Application de l'intelligence Economique dans un Système d Information Stratégique universitaire : les apports de la modélisation des acteurs THÈSE

Transcription

1 Université Nancy 2 Ecole Doctorale Langages, Temps, Sociétés Laboratoire Lorrain de Recherche en Informatique et ses Applications UMR 7503 Application de l'intelligence Economique dans un Système d Information Stratégique universitaire : les apports de la modélisation des acteurs THÈSE présentée et soutenue publiquement le 16 novembre 2006 pour l'obtention du Doctorat de l'université Nancy 2 Spécialité Sciences de l'information et de la Communication par Frédérique PEGUIRON Directeur de Recherche : Odile Thiéry Composition du Jury Président : Louis-Philippe LAPREVOTE : Professeur à l'université Nancy 2 Rapporteurs : Laïd BOUZIDI : Professeur à l Université Jean Moulin Lyon 3 Clément PAOLI : Professeur à l Université de Marne-la-Vallée Examinateurs : Amos DAVID : Professeur à l'université Nancy 2 Zineb HABBAS : Maître de Conférence à l Université Paul Verlaine de Metz Habilitée à Diriger des Recherches Odile THIERY : Professeur à l'université Nancy 2

2

3 Remerciements Je remercie Odile Thiéry, responsable permanent de l équipe SITE, professeur à l Université Nancy 2 et directrice du Service Commun du Pôle de gestion, pour avoir encadré mes travaux de recherche. Je la remercie pour la confiance qu elle m a accordée en me laissant toute latitude et en orientant mes recherches aux bons moments. Je lui sais gré d avoir rassemblé toutes les conditions favorables pour mener une expérimentation. Je remercie Amos David, responsable scientifique de l équipe SITE, professeur à l Université Nancy 2, de m avoir accueillie dans son équipe et lui exprime toute ma reconnaissance pour ses nombreux conseils pour la construction de ma thèse et pour son soutien tout au long de ces années de recherche. J exprime ma sincère reconnaissance aux membres du Jury : Monsieur Laid BOUZIDI Professeur à l Université Lyon 3, Madame Zineb Habbas Maître de Conférence à l Université Paul Verlaine de Metz Habilitée à Diriger des Recherches, Monsieur Louis-Philippe LAPREVOTE Professeur à l Université Nancy 2 et Monsieur Clément PAOLI Professeur à l Université Marne-la-Vallée pour avoir accepté de participer au Jury de ma thèse et pour avoir accordé de leur temps pour la lecture de cette thèse. Je remercie les personnels du Centre de Ressources Informatiques de l Université Nancy 2, notamment Brigitte Nominé directrice du CRI, pour nous avoir permis d obtenir des données propres à l université de façon à faire aboutir notre expérimentation à partir de données en «grandeur nature» et Vincent Mathieu chargé d extraire les données au bon format pour en faciliter le traitement. Mes remerciements vont également vers les personnels du Service Commun de la Documentation de l Université Nancy 2, Marie-Claude Barroche directrice du SCD et Anne Réveillé, pour nous avoir communiqué des données relatives au SCD du Pôle de Gestion de l Université Nancy 2. L expérimentation a été réalisée avec l aide de Florence Gayot et Jean-Philippe Camu du DESS Audit et Conception des Systèmes d Information puis par Thibault Chaix, Julien Vély et Benjamin Vise du Master Miage Audit et Conception des Systèmes d Information que je remercie vivement pour leur collaboration. Je remercie également les personnels des Moyens Informatiques du LORIA, et plus particulièrement Antoine Falcone, qui m a permis d avoir toutes les conditions idéales pour la réalisation d une application et qui m a aidée dans le traitement des données. J adresse mes remerciements à tous les membres de l équipe SITE pour l animation de débats fructueux lors des réunions, pour leur amitié et pour leurs encouragements. Je remercie ma famille pour la patience dont elle a fait preuve pour m aider dans l accomplissement de ce long travail. 1

4 2

5 Table des matières Introduction Partie I : Etat de l art Partie I - Chapitre 1 L intelligence économique L Intelligence Economique au travers de définitions L Intelligence Economique par l histoire Année 1960 : Harold Wilensky Année 1994 : Henri Martre Année 2003 : Bernard Carayon Année 2004 : Alain Juillet L Intelligence Economique par son processus Un processus de management stratégique Le fondement : le cycle du renseignement Les fonctions du cycle du renseignement L Intelligence Economique par ses acteurs Annuaire de l intelligence économique Les entreprises et l intelligence économique L intelligence économique et l appareil d Etat Acteurs de l intelligence économique en France Intelligence économique et directeur des systèmes d information Intelligence économique socle de la compétitivité des entreprises L Intelligence Economique par ses outils L Intelligence Economique par l équipe SITE-LORIA I.6.1 Modélisation de l utilisateur-acteur I.6.2 Modélisation de l interaction entre l utilisateur et le médiateur I.6.3 Conception et exploitation d un entrepôt de données I.6.4 Modélisation et développement de systèmes d intelligence économique I.6.5 Logiciel METIORE L Intelligence Economique par le dépouillement de listes de diffusion L Intelligence Economique par l analyse de bases bibliographiques Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Intelligence économique, business intelligence et information décisionnelle Système d information système d information décisionnel Système d information Système d information décisionnel Fonctions et architecture d un système d information décisionnel Difficultés rencontrées lors de la mise en œuvre du processus d évolution

6 2.3. De la conception des systèmes d information à la conception des systèmes d informations stratégiques Processus de modélisation Les entrepôts de données et les systèmes d informations stratégiques Bases métiers ou data marts L existant dans le contexte universitaire Paysage documentaire en réseau Existant des systèmes d information documentaires La brique documentaire d un environnement numérique de travail Partie I - Chapitre 3 Les acteurs Processus de recherche d information par les acteurs Méthode des 4P Le modèle EQuA²te Le modèle utilisateur De l utilisateur à l acteur Résumé de la première partie Partie II : Modélisation de l acteur d un SIS universitaire Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires Modélisation des ressources documentaires Typologie des ressources documentaires Description des ressources documentaires Les Métas informations et leur mise en application par les métas données Métas informations simples Métas informations prenant en compte des jugements de valeur Les métas données Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire Système d information de l université Exploitation du Processus Intelligence Economique Le cadre de l étude Système d intelligence économique révélateur du processus d intégration Partie II - Chapitre 6 La modélisation de l acteur Les acteurs dans l Université Contextualisation de la problématique par une analyse préalable Comment penser un modèle par rapport aux acteurs de l université? Vers l étudiant actif Enseignant en situation d élaboration d un cursus Les administrations

7 6.4. Classification des acteurs fondée sur leurs activités Processus de modélisation Type Besoins Fonctions Activités La visualisation des données Résumé de la deuxième partie Partie III : Le modèle RUBI 3 Amélioration et enrichissement du modèle par une expérimentation et une application Partie III - Chapitre 7 Etat de l art de l expérimentation Architecture fonctionnelle d un entrepôt de données L architecture physique sous jacente à un data warehouse L architecture technique sous jacente à un data warehouse Comment modéliser un entrepôt de données La modélisation par sujet La modélisation en étoile La modélisation en flocon La modélisation en constellation de faits Analyse multidimensionnelle Les bases de données multidimensionnelles Hypercube Construction des référentiels lors de l alimentation d un data warehouse Les composants d un système décisionnel (SIS) Définition de la fouille de données Le référentiel ou métas données Les outils Les solutions commerciales Les solutions alternatives Partie III - Chapitre 8 RUBI 3 RUBICUBE Comment mettre en relation acteurs et ressources électroniques? Mise en relation du modèle des ressources documentaires et du modèle des acteurs Phase 1 : expérimentation 2005 avec un produit commercial - COGNOS Phase 2 : expérimentation 2005/2006 avec un produit commercial - COGNOS Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Amélioration du modèle Introduction à l application : vers un schéma décisionnel Application avec un produit en open sources OPENI Introduction sur l Open Source

8 9.3.2 Introduction du moteur OLAP Mondrian Application Résumé de la troisième partie Conclusion et perspectives Annexes [A1] Annexes : Résultat du dépouillement des listes ( ) [A2] Annexes : Guide pour COGNOS [A3] Annexes : Produits commerciaux [A4] Annexes : Produits alternatifs [A5] Annexes : Récupération de données XML [A6] Annexes : Récupération de données Excel dans Access [A7] Annexes : Installation de Mondrian/Openi sous Windows [A8] Annexes : Profils utilisateurs dans Openi sous Windows [A9] Annexes : Schéma développé de l application sous Openi Glossaire Glossaire Sigles Sigles Bibliographie

9 Table des figures Figure : Etapes du processus d intelligence économique Figure : Intelligence économique en faveur de l action Figure : Cycle du renseignement Figure : Utilisateur - acteur dans l environnement de l entreprise Figure : SITE - L IE et les composants des systèmes d information : notre modèle Figure : Mise en perspective de l information trouvée à partir de METIORE Figure : Mise en perspective des thèmes des listes de diffusion et groupes de discussion Figure : Utilisation de Transformer Figure : Diagramme des catégories obtenu à partir de Transformer Figure : Rapport obtenu à partir du logiciel PowerPlay Figure : Sélection de notices autour de l intelligence économique dans EndNote Figure : Structuration systémique d une organisation Figure : Situation du système d information décisionnel au sein de la structuration systémique de l organisation Figure : Système d information décisionnel et processus Figure : Fonctions et architecture d un système d information décisionnel Figure : Système de gestion de bases de données, l architecture ANSI/SPARC Figure : Dynamique causale Figure : Représentation du SI-S et du S-IS Figure : Shibboleth : schéma tiré de la réunion Couperin, CRU Figure : Intégration de la brique documentaire dans le SID de l Université de Valenciennes Figure : Mise en perspective de la méthode des 4P déclinée selon 3 niveaux : processus, système, outils121 Figure : Prise en compte du phénomène normalisation pour la modélisation des ressources documentaires Figure : Formalisme de représentation Figure : Modélisation du type des documents Figure : Filtrage d information pour les ressources documentaires par mise en correspondance du profil document et du profil utilisateur Figure : Limites du système classique de description Figure : Limites des descriptions des ressources documentaires Figure : Méta référenceur Paloma Figure : Récupérateur de métas données Catalogue Figure : Architecture technique d Esup portail sous forme de briques Figure : Système d Information Global de l Université Nancy Figure : Le processus Intelligence Economique pour l intégration des services Figure : Intégration par le processus de l intelligence économique Figure : Mise en correspondance enseignant-enseigné Figure : Transposition d un document papier sous format numérique Figure : Processus plus élaboré de gestion de contenus

10 Figure : Données relatives aux acteurs Figure : Bases métiers dictées et adaptées aux utilisateurs finals Figure : Informations sur un micro contenu Figure : Informations relatives à différents niveaux d abstraction Figure : Un exemple de mise en situation d un enseignant lors de création de cours Figure : Relation entre descripteur et affiliation Figure : Modélisation des types d acteurs Figure : Besoins des acteurs Figure : Fonctions des acteurs Figure : Activités des acteurs Figure : Vue de l acteur étudiant Figure : Vues orientées acteurs tirées de l article en anglais pour SCI Figure : Architecture fonctionnelle d un entrepôt de données selon trois niveaux des données : acquisition, stockage, analyse Figure : Infocentre Figure : Système d information stratégique organisé autour d un data warehouse Figure : Modélisation par sujet Figure : Le modèle physique de données d une gestion de commandes de documents Figure : Schéma en étoile d une table de faits étudiants Figure : Schéma en flocon de neige Figure : Constellation de faits Figure : Exemple d un tableau de bord Figure : Principes MOLAP et ROLAP Figure : Dimensions et mesures Figure : Exemple de vision relationnelle et multidimensionnelle d un hypercube Figure : Système d alimentation d un data warehouse Figure : Caractéristiques des métas données Figure : Typologie des métas données d un entrepôt Figure : Exemple de 3 classes d objet modélisant l acteur étudiant Figure : Développement de la classe individu pour l acteur étudiant Figure : Classe diplôme Figure : Modélisation des interventions et diplômes de la composante UFR Math de Nancy Figure : Modélisation d un diplôme DEUG MISASHS 1A Figure : Prise en compte du contexte des utilisateurs Figure : Imbrication de RUBI 3 et RUBICUBE Figure : Maquette Excel avant la phase de reformatage Figure : Maquette Excel après la phase de reformatage Figure : Schéma entités associations Figure : Exemple de table pour un diplôme Figure : Exemple de table rajoutée pour certains cours Figure : Transformer récupère les données de la requête SQL

11 Figure : Grille des dimensions Figure : Diagramme de la dimension Diplôme Figure : Diagramme de la dimension NatureMatière Figure : Rapport Powerplay pour l hypercube étudiant Figure : Autre représentation visuelle de l hypercube étudiant Figure : Volume horaire d un étudiant de Maîtrise MIAGe Figure : Exemple d un fichier fourni par le Centre de Documentation Figure : 1 er type de fichier fourni Figure : 2 ème type de fichier fourni Figure : Exemple de fichier retraité Figure : Récupération des données de la base Access via Transformer Figure : Exemple de catégorisation Figure : Cube du nombre d exemplaires prêtés par catégorie pour l année Figure : Haut du fichier XML Figure : Bas du fichier XML Figure : Haut du fichier serveur XML Figure : Bas du fichier serveur XML Figure : Fichier obtenu partie «Traitements» Figure : Fichier obtenu partie «Statistiques par Jours et par Type de Personnes» Figure : Fichier obtenu partie «Cumul du Mois» Figure : Exemple de fichier retraité partie «Statistiques par Jours et par Type de Personnes» Figure : Exemple de table créée dans Access à partir d un fichier XML via Excel Figure : Cube pour les statistiques par jour et par service Figure : Rapport pour les statistiques par jour et par service Figure : Objectifs du processus de modélisation Figure : Processus global de la modélisation d un système d information stratégique universitaire avec prise en compte du modèle utilisateur Figure : Illustration des informations proposées par rapport aux profils des utilisateurs au sein d une université Figure : Formalisation des descripteurs Figure : Mêmes données de notices bibliographiques en XML stylées de manière différente (liste ou tableau) Figure : Scénario de notre application Figure : Données textes de la table statjours Figure : Données textes de la table statmois Figure : Données numériques de la table de faits jours Figure : Données numériques de la table de faits mois Figure : Cube «modèle jour» Figure : Cube «modèle mois» Figure : Schéma Mondrian Figure : Correspondant entre la table de faits et la table satellite Figure : Cube sous Mondrian

12 Figure : Environnement graphique d analyse et de gestion d Openi Figure : Items et groupes d acteurs selon RU=(T,B,F,A) Figure : Rôle des acteurs sur le SIS universitaire et conséquences sur les vues métiers Figure : Formulaire de recensement élaboré à partir de RU=(T,B,F,A) Figure : Organigramme du script RUBI 3 en mysql Figure : Analyse dynamique des données du formulaire faite par l utilisateur néophyte Table des tableaux Tableau : Données signalétiques autour de quelques acteurs de l intelligence économique à partir de l ouvrage de Maurice Botbol et Isabelle Verdier Tableau : Liste non exhaustive de la classification des secteurs d intervention de l intelligence économique pour les universitaires Tableau : Classification des secteurs d intervention de l intelligence économique pour les consultants Tableau : Classification des secteurs d intervention de l intelligence économique pour les institutionnels.49 Tableau : Classification des secteurs d intervention de l intelligence économique pour les entrepreneurs. 49 Tableau : Représentation des catégories d application de certains éditeurs d outils utilisés en intelligence économique à partir du Journal du Net Tableau : Données signalétiques autour des éditeurs d outils utilisés en intelligence économique à partir du Journal du Net Tableau : Situation de nos travaux de recherche par rapport à la modélisation processus de l intelligence économique élaborée par l équipe SITE-LORIA Tableau : Listes de diffusion et groupes de discussion étudiés de 2001 à Tableau : Tableau synthétique autour d indicateurs pour l année Tableau : Tableau synthétique autour d indicateurs pour l année Tableau : Tableau synthétique autour d indicateurs pour l année Tableau : Tableau synthétique autour d indicateurs pour l année Tableau : Tableau synthétique autour d indicateurs pour l année Tableau : Tableau synthétique autour d indicateurs pour l année Tableau : Récupération de notices bibliographiques pour le mois de janvier Tableau : Intérêt des revues de documentation à l intelligence économique Tableau : Pull Tableau : MILLENNIAL CHARACTERISTICS selon Richard Sweeny Tableau : Besoins, rôles et fonctions des acteurs Tableau : Evolution des besoins et des activités au cours de l année Tableau : Identification des besoins de l étudiant selon ses fonctions au cours du temps Table des graphiques Graphique : Hypercube autour des secteurs Graphique : Dates «phare» de l intelligence économique entre 1993 et Graphique : Représentation en histogramme de la relation entre les activités et les acteurs sous catégorisés

13 Introduction 11

14 12

15 Introduction Notre thèse porte sur l application de l'intelligence Economique dans un Système d Information Stratégique Universitaire par les apports de la modélisation des acteurs. Nous empruntons le processus d intelligence économique pour faire évoluer un système d information universitaire en un système d information stratégique universitaire. L hypothèse de notre étude consiste à montrer que, si nous recourons à la modélisation des utilisateurs en amont de la conception d un système d information de ressources documentaires, nous aboutissons à une amélioration de la satisfaction des usagers ou utilisateurs finals du système d information. Cette hypothèse s applique dans un cadre universitaire. Notre problématique formulée selon la question suivante : «Comment intégrer la représentation de l utilisateur dans un système d information stratégique universitaire?» guide notre démarche pour atteindre les objectifs définis dans notre hypothèse de départ. Une étude sur les fonctions, les usages et les besoins des utilisateurs participe à la représentation de l utilisateur du système d information universitaire. La classification des utilisateurs selon leurs activités sur le système aboutit à des constatations qui les font passer au rang d «acteurs». Nous sommes dans un environnement de formation où évoluent des acteurs qui ont recours à des systèmes de ressources documentaires, des systèmes de production d information et des systèmes de recherche d information. Les dispositifs des technologies éducatives mettent à disposition : des cours, des projets accessibles via des systèmes de partages d informations d où se dégagent de nouvelles fonctionnalités. Nous avons remarqué plusieurs enjeux qui vont en faveur de la spécification de notre problématique. Les étudiants ont pour but de réussir, apprendre mieux, autrement, efficacement par la construction d un projet professionnel qui doit les aider à trouver un emploi. Parallèlement au problème de la mise en valeur du contenu des informations, la visibilité des auteurs peut être améliorée par la prise en compte de l architecture des supports électroniques dans un contexte de production. Par ailleurs, on constate que l usage qui est fait de l information trouvée reste le point aveugle ; cette constatation nous oriente vers la proposition d un système d information où l acteur évolue dans un système d information collaboratif. Le processus de l intelligence économique permet d évaluer les «prises de risques» ou au contraire les «bénéfices ramenés» à prendre en compte les enjeux pour l urbanisation d un système d information universitaire. 13

16 Introduction Le recours à l entrepôt de données comme outil d une expérimentation à l Université Nancy 2 nous a offert la possibilité d améliorer notre modèle. Voici quelques indications pour faciliter la lecture de ce présent document. Explicitons notre «mémoire de thèse» selon deux aspects : le contenant et le contenu pour dissocier la forme du fond du document. Le contenant d un objet exprime ce qu il contient. Cela nous permet d aborder la forme du mémoire de thèse. Le contenu exprime ce qui est renfermé dans quelque chose, c est-à-dire la teneur de l objet. Ce niveau favorise l expression du fond du mémoire de thèse. Le contenant Le contenant aborde l aspect physique de la rédaction de la thèse. Notre «document» comporte trois parties, construites elles-mêmes à chaque fois autour de trois chapitres. Les chapitres renferment plusieurs sections et paragraphes. La figure ci-dessous représente la forme de notre document à l aide d une triade : Partie Partie 3 Partie 2 3 Figure I: Représentation de la forme du document thèse par une triade Pourquoi une triade? Dans la langue française, on peut rapprocher «trois» et «très», qui dans un certain sens signifient beaucoup, de la préposition latine «trans» qui signifie au-delà. L anglais «thrice» signifie trois fois et parfois plusieurs et les mots «three» (trois), «throng» (foule) et «throug» (au-delà), ont visiblement la même racine. Ainsi les trois premiers nombres ont-ils été utilisés très tôt, trois pouvant signifier à la fois trois et au-delà de trois. En deçà de l exploitation d un système symbolique, le chiffre trois marque vraisemblablement les limites biologiques naturelles de l estimation perceptive d une quantité d objets, assujettie à la capacité de mesure de l œil. Cette aptitude allant rarement au-delà de quatre. La construction physique du document autour de trois (trois parties, comportant à chaque fois trois chapitres) facilite le fil conducteur de la lecture. 14

17 Introduction Le contenu Avant toute contextualisation, notre thèse aborde trois thématiques complémentaires : l intelligence économique, le système d information et les acteurs. Ce contenu se trouve en première partie et fait l œuvre d un état de l art. La figure suivante représentant un plan en spirale illustre un premier passage pour avoir un point de vue global de ces trois thématiques, qui constituent chacune une section. Figure II: Plan «spiral» de la première partie La première partie concerne l intelligence économique, les systèmes d information et les acteurs. Par les recherches, nous constatons que l intelligence économique souvent décrite à l aide d un vocabulaire guerrier, semble être l apanage des entreprises ou institutions privées. Aujourd hui, les universités évoluent dans un contexte de concurrence. Les étudiants, au moment de prendre une inscription dans un établissement opèrent selon une démarche qualité. La notion de qualité est présente dans le monde de l industrie depuis une centaine d années. Aujourd hui, la gestion par la qualité est le facteur de réussite d une entreprise. Vendre un produit ou un service de qualité est la clé de la satisfaction de la clientèle et donc de sa fidélité. C est dans la recherche de la satisfaction du client que nous pouvons faire un parallèle entre les entreprises et les universités ; pour les entreprises la démarche de gouvernance est à but lucratif, pour les universités la démarche de gouvernance concerne davantage un positionnement et une visibilité de l organisation, le but qui peut tendre également vers une recherche de rentabilité, vise principalement à une facilitation de la gestion. L entreprise est en quête d un positionnement de performance au niveau de son capital, l objectif d une université est d atteindre le label niveau 1 de qualité dans le classement des universités. Dans le premier cas cela passe par la satisfaction des clients. Dans 15

18 Introduction le second cas, le but est de satisfaire les utilisateurs. La satisfaction des clients en entreprise se formalise en termes de coûts. La satisfaction des utilisateurs en université s illustre par la satisfaction de leurs besoins. La seconde partie contextualise les trois thématiques présentées dans l état de l art par rapport à notre sujet de recherche. Nous explicitons alors notre contribution. Un premier chapitre explicite le recours aux normes et standards pour modéliser les ressources documentaires mises à la disposition des utilisateurs. Le second chapitre met en valeur le processus de l intelligence économique pour intégrer la modélisation de l utilisateur lors de l urbanisation d un système d information universitaire. Ici nous réfléchissons à l amélioration d un système d information universitaire pour l amener au rang d un système d information décisionnel dans un contexte éducatif. Enfin le troisième chapitre traite de la modélisation de l acteur. Voici comment résumer la seconde partie de notre thèse à l aide du schéma ci-dessous : Modélisation Institution universitaire Système d information Figure III: Deuxième partie : enrichissement du plan «spiral» de la première partie Cette seconde partie est le lieu où nous pourrons répondre à la question suivante : «Entreprendre une démarche d intelligence économique dans l amélioration d un système d information permet-il d améliorer les prestations offertes aux usagers d une université et d optimiser les services afin d arriver à satisfaire ses utilisateurs?» Pour répondre à cette question, nous nous appuyons sur un état de l art pour mettre en perspective les thématiques étudiées par rapport au système d information d une université et de ses acteurs. Au sein d une université cohabitent de nombreux systèmes d information spécifiques aux besoins des composantes qui la constituent. Ces systèmes d information épars 16

19 Introduction abritent des informations qui peuvent être utiles aux composantes voisines. Nous mettons en relief que la prise de décision revient à l utilisateur final qui évolue dans un système de recherche d information. La modélisation des ressources documentaires permet d améliorer le profilage des informations recherchées et contribue à améliorer la visibilité des auteurs. Différentes étapes (concept-théorie-méthode-modèle) empruntées à une démarche scientifique nous permet de mettre en œuvre le processus de modélisation de l utilisateur d un système d information. La troisième partie concerne la proposition de notre application. Nous aboutissons à la proposition d un modèle de l utilisateur final d un système d information dans un contexte universitaire : RUBI 3 qui signifie {Représentation des Utilisateurs et de leurs Besoins en Information lors de l Interrogation après Identification}. Ce modèle prend en compte les besoins des utilisateurs dès la conception du système d information. Le recours à l entrepôt de données en tant qu outil permet de faire évoluer un système d information en un système d information stratégique dans un contexte d intelligence économique. De cette étude naît un acronyme RUBICUBE, terme mnémotechnique au service de la réalisation d un entrepôt de données qui signifie {Récupération, Utilisateur, Besoins, Identification, Classification, Usinage, Bases métiers, Enrichissement}. C est à ce niveau de domaine d application que nous proposons des solutions sous forme d une expérimentation. Cette phase d expérimentation puis d application aboutit à l amélioration du modèle RUBICUBE qui permet un raisonnement par niveaux autour de notre concept d application, c est-à-dire le Système d information. La classification des acteurs de l université fondée sur leurs activités entreprise en deuxième partie permet de construire les bases métiers d un entrepôt de données filtrées par rapport aux acteurs pour mettre en place des scénarios d analyse. Ainsi nous avons montré qu il est possible de mettre à la disposition des décideurs de l université des informations synthétiques autour d indicateurs choisis par eux, pour leur permettre de réaliser des tableaux de bord, afin de procéder à des constats, des suivis d opérations et de prévisions ou pour mettre en évidence les causes de certains faits. L analyse des rôles des différents acteurs, en situation de recherche d information, nous permet de dresser des métas données, afin de prendre en compte le comportement des utilisateurs lors de la constitution de l entrepôt de données et l amélioration du système d information. 17

20 Introduction Un système d information stratégique permet aux décideurs d une institution de disposer d informations pertinentes et d outils d analyse puissants pour les aider à prendre les bonnes décisions au bon moment. Pour mieux répondre aux besoins des utilisateurs, nous essayons de personnaliser les réponses du système. La représentation de l utilisateur et de ses comportements dans les bases métiers facilite le processus de recherche d information. La modélisation des acteurs d une part et des types de documents d autre part, permet d élaborer des corrélations afin d améliorer les réponses. La description de ressources, en vue de leur réutilisation dans des parcours de formation, évoquent les difficultés rencontrées et formulent des propositions pour combler des manques dans les normes existantes et rendre plus opérationnels certains descriptifs. La mise en relation des acteurs et des documents est possible par les métas données de l entrepôt de données et la méta modélisation de l entrepôt de données. Afin de procéder au mieux au développement de notre contribution au système d information stratégique, la méta modélisation de l entrepôt de données permet d élaborer un schéma directeur pour la construction de l entrepôt de données. Nous allons à présent aborder les trois parties que nous pouvons synthétiser pour mémoire ainsi : Un état de l art sur l intelligence économique, les principes de gestion par le système d information et les systèmes d information universitaires et fonctionnalités orientés acteurs. La modélisation de l acteur d un Système d Information Stratégique universitaire par la prise en compte des normes et standards pour modéliser les ressources documentaires, l intelligence économique intégrant la modélisation de l utilisateur et la modélisation de l acteur. La prise en compte du modèle RUBI 3 pour l expérimentation et une application favorisant l amélioration et l enrichissement du modèle global du système d information. En conclusion, nous aurons montré que l acception du terme Intelligence Economique n est pas encore suffisamment stabilisée pour en faire une discipline - preuve le nombre de définitions proposées dans l état de l art et le nombre de «pratiquants». De notre point de vue nous considérons le terme comme un concept et non une discipline car ce terme est ambigu dans le langage courant. Au travers des nombreux articles analysés dans l état de l art nous assistons à un mélange de termes comme «discipline», «domaine scientifique», «domaine de 18

21 Introduction recherche» et «axe de recherche». Il ne revient pas à une seule équipe de résoudre ce problème de langage. En outre, nous essayons d apporter notre contribution à l évolution du monde scientifique en choisissant l Intelligence Economique comme un objet scientifique sur lequel nous pouvons mener des études de recherche. Pour résumer les trois parties sont organisées comme suit : Première partie : Etat de l art Chapitre 1 L intelligence économique Chapitre 2 Les Principes de gestion par les systèmes d information Chapitre 3 Les acteurs Deuxième partie : Modélisation de l acteur d un SIS universitaire Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire Chapitre 6 La modélisation de l acteur Troisième partie : Le modèle RUBI 3 Amélioration et enrichissement du modèle par une expérimentation et une application Chapitre 7 Etat de l art de l expérimentation Chapitre 8 RUBI 3 RUBICUBE Chapitre 9 Amélioration du modèle et son exploitation pour une application Pour faciliter la réception de notre texte, nous imageons notre discours par des schémas dont le rôle est de faciliter la compréhension des concepts apportés. 19

22 20

23 Partie I : Etat de l art Si vis pacem para bellum. [Jules César] 21

24 22

25 Partie I - Chapitre 1 L intelligence économique 23

26 24

27 Partie I - Chapitre 1 L intelligence économique Ce chapitre dessine les contours de l intelligence économique, son fondement et son évolution. Nous allons montrer que l intelligence économique est un concept, concept enseigné en tant que discipline dans certaines filières de formation. C est aussi un processus, processus que nous incluons en tant qu objet de recherches dans nos travaux. L analyse d articles de presses, d ouvrages et d Internet complétée par une analyse de listes de diffusion, puis par l analyse d une recherche effectuée dans les bases bibliographiques met en relief l imbrication de différentes disciplines scientifiques. Une idée forte prédomine dans l opinion qui tend à associer la naissance de l intelligence économique à l effondrement du bloc de la guerre froide faisant basculer le monde globalisé dans une guerre économique. Cette appréhension du concept «intelligence économique» a été confortée par une catégorie d acteurs qui occupaient une place dans l espionnage, qui n avait plus lieu d exister sous la même forme, et qui ont fondé ou migré vers des sociétés de renseignements au profit de renseignements économiques pour un monde à dominante concurrentielle. Différents articles dans la presse informatique et professionnelle témoignent de la place importante occupée par l intelligence économique dans les industries. Il faut se tourner vers [WILENSKY, 1967] pour trouver les premières analyses autour de l intelligence économique. Le rapport Martre [MARTRE, 1994b] énonce les grands principes et trace les politiques à mettre en oeuvre. Le rapport Carayon [CARAYON, 2003] propose des axes de travail et aboutit à la nomination d un représentant de l intelligence économique au sein de l Etat : Alain Juillet [ARPAGIAN, 2004a]. Cette nomination marque une étape, avalise l intelligence économique et incite à encourager les PME et PMI à développer des cellules d intelligence économique au sein de leurs établissements. L intelligence économique est un concept qui fait l objet de multiples définitions. On peut le définir d un point de vue historique, par l action ou par les applications. De ce fait, nous ne trouvons pas de normes et de standards, ni d outils qui soient spécifiques à proprement parler à ce concept. En revanche, c est par les applications que l on cernera les normes, standards et outils qui gouvernent les systèmes d information, les entrepôts de données et les ressources documentaires lors d une démarche d intelligence économique. Comme nous le verrons au cours de l étude de l état de l art, les systèmes d information jusqu à une période récente étaient, dans la majorité des cas, la juxtaposition d applications 25

28 Partie I - Chapitre 1 L intelligence économique technologiques isolées. Cependant, des améliorations considérables naissent comme, par exemple le procédé Ldap 1, véritable pivot des systèmes d information. C est dans cet esprit d amélioration ou d urbanisation des systèmes d information, que nous employons le concept d intelligence économique pour nos travaux de recherche. Nous voulons montrer par ce travail, qu après une étude de l existant des systèmes d information dans l université, l amélioration ou l urbanisation des systèmes d information passe par la prise en compte des normes et standards en vigueur pour la conception d un système d information ; le but étant de favoriser l interopérabilité, la réutilisabilité et la pérennité des informations. La modélisation permet de repérer certains manques dans les normes et standards, avant de pouvoir passer à la mise en pratique des procédés. Le processus de modélisation doit tenir compte des objets qui le constituent, qui changent ou qui évoluent régulièrement - par exemple les besoins des acteurs changent au cours du temps et au cours des réformes. Comme nous le démontrons un système d information stratégique, reposant sur un entrepôt de données, est un système en interaction permanente entre l amont et l aval ou entre le back office et le front office. C est pourquoi, le processus de vérification, normalement inscrit en bout de chaîne d un système, fait partie dans nos réflexions, d une boucle dont les analyses doivent pouvoir être prises en compte en aval, pour enrichir et améliorer le système d information. Une analyse fine de l intelligence économique sous un angle bibliométrique réaffirme que très tôt les sciences de l information et de la documentation font référence à l intelligence économique. On constate que les établissements documentaires consacrent des rayons aux ouvrages sur l intelligence économique et des rubriques dans leurs revues sur la documentation professionnelle. Si l intelligence économique est une discipline à part entière, enseignée dans les universités, constituant la source de nombreuses recherches au sein de laboratoires, peu d articles témoignent de l usage de l intelligence économique comme un processus de gestion dans les universités. Après cette première partie, nous livrerons le résultat de nos recherches pour montrer comment les universités peuvent mettre en place un 1 Lightweight Directory Access Protocol (LDAP) est un protocole permettant l'accès des annuaires. LDAP est initialement un frontal d accès à des bases d annuaires respectant la norme X.500. Il est devenu un annuaire natif (standalone LDAP) utilisant sa propre base de données, sous l impulsion d une équipe de l'université du Michigan. 26

29 Partie I - Chapitre 1 L intelligence économique processus d intelligence économique. Processus que nous concrétisons par le recours à l entrepôt de données qui est un outil au service de l intelligence économique. Comment expliquer, comprendre, situer, exploiter, appliquer l intelligence économique? Pour aborder l intelligence économique, les sections qui suivent, permettent de : La cerner par des définitions, La situer par des aspects historiques, la comprendre par ses acteurs et des analyses, l appréhender par le point de vue de l équipe SITE-LORIA, l exploiter par des outils, la cerner par le dépouillement des listes de diffusion, l observer au travers de son évolution par les bases bibliographiques L Intelligence Economique au travers de définitions C est Outre-Atlantique que le concept d intelligence économique a connu ses premiers développements, il y a une dizaine d années, pour constituer aujourd hui un domaine d activité particulièrement dynamique. Aux Etats-Unis, cette notion, se caractérise également par sa dimension active, dimension qui semble à ce jour un peu négligée dans la définition et la mise en œuvre de l intelligence économique en France. En France, l intelligence économique est un concept relativement nouveau. Il n existe pas de définition unique de l intelligence économique. Pour Bernard Besson et Jean-Claude Possin [BESSON et POSSIN, 1996], il s agit de : «La capacité d obtenir des réponses à des questions en découvrant des intelligences entre deux ou plusieurs informations préalablement mémorisées. L entreprise mettra au service de cette capacité tous les moyens dont elle dispose pour saisir des opportunités ou détecter des menaces». Le groupe de travail présidé par Henri Martre [MARTRE, 1994b], en 1994, retient de l intelligence économique la définition suivante : «L intelligence économique peut être définie comme l ensemble des actions de recherche, de traitements et de diffusion (en vue de son exploitation) de l information utile aux acteurs économiques» Carlo Revelli [REVELLI, 1998] propose une définition qui tient compte de ces concepts : «Processus de collecte, traitement et diffusion de l information qui a pour objet la réduction de la part d incertitude dans la prise de toute décision stratégique. Si à 27

30 Partie I - Chapitre 1 L intelligence économique cette finalité on ajoute la volonté de mener des actions d influence, il convient de parler alors d intelligence économique». Celle-ci ne se résume évidemment pas à la surveillance des activités des concurrents. C est l ensemble de l environnement de l entreprise qui est concerné. Ces diverses actions sont menées en toute légalité et en préservant les informations stratégiques de l entreprise. L intelligence économique a pour objectif de permettre aux décideurs et managers de l entreprise de disposer d une information de valeur, à laquelle ils puissent se fier dans le cadre de leurs prises de décision. Pour cela, il s agit de produire de l information pertinente et à forte valeur ajoutée. Cette exigence doit se retrouver à travers les différentes phases du processus : Collecte de l information, Traitement, Diffusion. Collecte Sources d information Formelles Informelles Traitement Figure : Etapes du processus d intelligence économique Nous verrons en 1.6 comment se situent les huit étapes retenues par l équipe SITE-LORIA. L intelligence économique est une interface entre l entreprise et son environnement. Les stratégies de différenciation entre concurrents de plus en plus complexes et précises obligent les entreprises à considérer l information comme une valeur, une «ressource» à part entière. L information est «intégrée comme bien immatériel à l outil de travail. Elle est à ce titre une source collective de profit et une des garanties de la pérennité de l entreprise» [MARTRE, 1994b]. Diffusion Puissant outil de connaissance à la disposition des entreprises, le concept d intelligence économique doit être envisagé dans une perspective à long terme, au fur et à mesure duquel l entreprise sera amenée à acquérir une intelligence aussi bien économique que «culturelle» de son environnement et de ses concurrents. Récepteur L intelligence économique a également pour rôle de valoriser l information en la faisant circuler dans l entreprise. Cette caractéristique peut s appuyer sur les réseaux internes de 28

31 Partie I - Chapitre 1 L intelligence économique l entreprise comme l intranet. L intelligence économique prend aussi en compte l aspect défense des informations et des «savoir-faire» de l entreprise. Nous considérons l Intelligence Economique, comme un choix d approche pour notre étude. Nous l envisageons alors comme l ensemble des méthodes et des techniques de gestion de l information et d utilisation des flux d information pour l anticipation des évolutions, pour l action d apprentissage organisationnel et pour l activité stratégique d adaptation de l institution à l environnement et aux besoins des utilisateurs. L intelligence économique se pratique donc en vue de l action, de l accroissement des performances et de la meilleure satisfaction du client, de la modification des conventions, par la forte circulation de l information dans l institution. Elle suppose le développement de la capacité interprétative et de l apprentissage, des représentations, de la capitalisation des connaissances et du développement des compétences. Dans son article du premier numéro de la Revue Française d Intelligence Économique, [COLLETIS, 1997] montre que l intelligence économique est un nouveau concept en analyse économique dans un système de création de richesses fondé sur le savoir. Après ce rapide tour d horizon du concept «Intelligence Economique», un historique plus détaillé permet d en identifier la naissance et l évolution L Intelligence Economique par l histoire Les sources Le désir de connaître [DELBECQUE, 2004] pour maîtriser davantage son environnement en élaborant une stratégie et en mettant en œuvre des tactiques constitue l un des fondements de toute démarche anthropologique. L homme veut savoir pour agir : c est une donnée de base de la condition humaine. Or, c est le socle même de l intelligence économique [COUZINET, 2005]. Cette démarche ne constituait pas, jusqu à la fin des Trente Glorieuses une nécessité comparable à celle qu elle est aujourd hui devenue. L intelligence économique et concurrentielle, également qualifiée de stratégique, constitue l héritage, la résultante de cinq grandes dynamiques historiques, à savoir : La mutation conflictuelle endogène du capitalisme, liée à la difficulté accrue de conquête et de maîtrise des marchés, c est-à-dire au coût de conservation ou d acquisition d un avantage compétitif dans le cadre d un monde globalisé, 29

32 Partie I - Chapitre 1 L intelligence économique La rupture des logiques de bloc de la Guerre Froide, génératrice de complexité et donc démultiplicateur d incertitude, L évolution des formes de la guerre articulées sur les métamorphoses de la contrainte, qui établit la guerre économique comme conflictualité dominante, dans le cadre de relations de coopération/concurrence, dénommées «coopétition» 2, L émergence de la société de l information, à la fois créatrice de concurrence et facteur de suprématie cognitive, donc économique, L impératif d une gestion offensive de l information, haussée au rang de capital stratégique, pour conserver ou acquérir la position dominante dans le rapport nécessairement asymétrique à l information. Parce que ces tendances de fond sont autant de défis accentuant la dimension conflictuelle de l activité économique, le caractère structurant de cette conflictualité pour le monde social, et la complexité de l environnement global dans lequel elle s inscrit et se développe, il fallait approcher l économie de marché différemment : à «nouvel esprit» du capitalisme, nouvelle posture intellectuelle et praxis Ce que constitue précisément l intelligence économique, et la rend tout à la fois l outil indispensable et premier du management stratégique Année 1960 : Harold Wilensky Harold Wilensky [WILENSKY, 1967] est un sociologue américain qui propose dès les années 1960, le concept d intelligence organisationnelle. Pour lui, l intelligence organisationnelle se décline à travers le recueil, l analyse, l interprétation et la diffusion de l information utile au processus de décision de l organisation. H. Wilensky pose les deux grandes problématiques qui font aujourd hui l objet de tant de préoccupations : Les stratégies collectives et la coopération entre gouvernements et entreprises dans la production d une connaissance commune pour la défense de l avantage concurrentiel, L importance de la connaissance dans l économie et l industrie comme moteur stratégique du développement et du changement. Si l information est source de pouvoir, elle est aussi source de «confusion» : le fameux «trop d information tue l information». Cette défaillance exacerbe les problèmes que rencontre le 2 Coopétion : Néologisme formé par la collision des mots coopération et compétition. Désigne le fait que des entreprises concurrentes partagent des investissements ou d autres ressources, le plus souvent pour se partager des économies d échelle. 30

33 Partie I - Chapitre 1 L intelligence économique renseignement, donc notamment l intelligence économique. L intelligence économique pâtit souvent d une mauvaise image liée, la plupart du temps, à la mauvaise gestion du secret (versus partage), et aux structures (hiérarchies et cloisonnements versus réseau). Selon [WILENSKY, 1967], le développement d Organisations intelligentes et leur protection contre les «pathologies liées à la mauvaise gestion de l information» réside dans le comportement des décideurs vis-à-vis de la connaissance et dans la capacité des spécialistes de l information à influencer le cours de la stratégie. Il est essentiel alors de conjuguer les techniques d intelligence économique avec le pilotage stratégique et les processus décisionnels. Pour Harold Wilensky, l intelligence économique ne consiste pas en l accumulation brouillonne d informations : il s agit de produire des connaissances à vocation opérationnelle, dont la qualité dépend des compétences d interprétation et d analyse du facteur humain. On peut compléter ce raisonnement en se rappelant ce qu affirmait Edgar Morin [MORIN, 1999] avec raison : «l intelligence, écrivait-il, est l aptitude à s aventurer stratégiquement dans l incertain, l ambigu, l aléatoire en recherchant et utilisant le maximum de certitudes, de précisions, d informations. L intelligence est la vertu d un sujet qui ne se laisse pas duper par les habitudes, craintes, souhaits subjectifs. C est la vertu qui se développe dans la lutte permanente et multiforme contre l illusion et l erreur». En somme, l intelligence du monde [DELBECQUE, 2004] (à commencer par celle que l on dit «économique et concurrentielle») colonne vertébrale du processus décisionnel vise à réduire les incertitudes, autant que faire se peut, pour prendre des décisions optimales, donc minimisant les risques. L intelligence économique et concurrentielle s appréhende conséquemment comme un prolongement, non comme un substitut ou un dépassement du management de l entreprise. L intelligence économique implique l action. Pour cette raison, un tel dispositif ne peut se réduire à une cellule dite d intelligence économique : il se doit d innerver l organisation entière et de mobiliser un périmètre d individus bien plus large que celui des acteurs spécialisés officiellement impliqués dans l activité de veille. Nous pouvons compléter notre Figure par la notion d action : 31

34 Partie I - Chapitre 1 L intelligence économique Collecte Sources d information Formelles Informelles Traitement Diffusion Action Récepteur Figure : Intelligence économique en faveur de l action C. Harbulot et P. Baumard [HARBULOT et BAUMARD, 1997] commentent les propos d Harold Wilensky dans «Organizational Intelligence: Knowledge Policy in Government and Industry» et insistent sur le fait que l intelligence économique est un processus de production de connaissances, par les gouvernements et des industriels, et, lorsque nécessaire, dans le cadre de stratégies collectives Année 1994 : Henri Martre L effondrement du bloc communiste et la fin de l affrontement entre les deux entités idéologiques dominantes [MARTRE, 1994b] marquent l avènement d une nouvelle géographie économique du monde. La dimension marchande et financière des activités économiques prend une importance inégalée et la pression concurrentielle internationale touche progressivement l ensemble des secteurs d activités. Désormais, les relations de coopération-concurrence entre les nations et entre les entreprises se développent sur plusieurs échiquiers au rythme de logiques complexes et parfois contradictoires. Les entreprises multinationales évoluent au cœur des échanges mondialisés dans une relation permanente de recherche d alliance et de concurrence. Cette même logique prévaut entre les blocs économiques tels l Union Economique Européenne ou l Alena 3, regroupant un nombre croissant de pays industrialisés. A l échelle des nations, les relations économiques internationales démontrent un regain des dynamiques nationales. Le niveau régional ou local pour sa part, devient porteur d une nouvelle pratique stratégique, en particulier entre les régions européennes. Les entreprises sont désormais contraintes d ajuster leurs stratégies en fonction d une nouvelle grille de lecture intégrant la complexité croissante des réalités concurrentielles à l œuvre sur ces différents échiquiers mondiaux, nationaux et locaux. L efficacité d une telle 3 ALENA : Accord de libre-échange nord-américain 32

35 Partie I - Chapitre 1 L intelligence économique démarche repose sur le déploiement de véritables dispositifs d intelligence économique qui instituent la gestion stratégique de l information comme l un des leviers majeurs au service de la performance économique et de l emploi. L intelligence économique devient un outil à part entière de connaissance et de compréhension permanente des réalités des marchés, des techniques et des modes de pensée des concurrents, de leur culture, de leurs intentions et de leur capacité à les mettre en oeuvre. Elle se définit alors comme l ensemble des actions coordonnées de recherche, de traitement, de distribution et de protection de l information utile aux acteurs économiques obtenue légalement. Dans le contexte actuel de compétition économique mondiale, l analyse des systèmes d intelligence économique étrangers les plus performants devient une nécessité. Il s agit moins de rechercher des modèles transposables à la France que d identifier les atouts et les lacunes du dispositif français et de comprendre pourquoi des économies de marché ont produit des systèmes de gestion stratégique de l information plus performants que d autres. L intelligence économique s est développée sur des bases historiques et culturelles selon des formes différentes au Japon, en Allemagne, au Royaume-Uni, en Suède ou aux Etats-Unis. Ainsi, le savoir-faire allemand dans la gestion stratégique de l information provient avant tout de l essor historique du commerce de l Allemagne à l étranger. Aujourd hui, les flux d informations convergent vers un centre stratégique caractérisé par le maillage d intérêts qui associent les banques, les grands groupes industriels et les sociétés d assurances. Les syndicats allemands, grâce à leurs contacts extérieurs, sont très actifs dans la défense des intérêts économiques du pays. Le consensus sur la notion d intérêt économique national constitue dès lors l un des principaux atouts culturels de la performance économique allemande. Dans une même logique, les Japonais ont constitué leur appareil industriel et commercial sur la base d un usage intensif de l information économique au service de l indépendance nationale. La compétitivité de l économie japonaise repose essentiellement sur une culture collective de l information. En particulier, les grands conglomérats opèrent une couverture des marchés internationaux à travers un réseau mondial d information fonctionnant en temps réel. Une solidarité de fait s instaure entre les entreprises et l administration. 33

36 Partie I - Chapitre 1 L intelligence économique Contrairement à ces deux modèles, le Royaume-Uni, qui a fondé sa domination durant la première révolution industrielle sur un puissant dispositif de renseignement économique, n a pas transféré ce savoir-faire au service de son industrie nationale. En effet, le système britannique d intelligence économique se concentre aujourd hui essentiellement sur le secteur de la finance. Par rapport à ces différents modèles, il convient de mettre en perspective l évolution en cours de pays tels que les Etats-Unis et la Suède. L économie américaine dispose d un système d intelligence économique riche et diversifié. Mais à l inverse d autres pays, la logique qui le gouverne est essentiellement individuelle. Née de la politique des entreprises dans les années cinquante, l intelligence économique aux Etats-Unis est longtemps demeurée l outil de leurs rivalités concurrentielles sur le marché domestique. Le débat actuel relatif à l élaboration d une doctrine dite de sécurité économique pour la défense de l industrie et de l emploi américain atteste d une évolution majeure vers une gestion collective «public-privé» de l intérêt national. Selon cette même logique, la Suède demeure très active dans le domaine de l intelligence économique. La symbiose entre les entreprises et l administration est en effet illustrée par des réunions au niveau national, dont l objectif vise à élaborer une stratégie de renseignement économique ouvert au service de la performance de l économie suédoise. Face à l efficacité des systèmes développés par les «partenaires-concurrents» de la France, notre dispositif d intelligence économique demeure très en retrait, à l heure où la compétition sur les marchés globalisés appelle l urgence d une mobilisation collective des capacités offensives et défensives des acteurs économiques. Malgré les initiatives développées par certains experts qui ont mis en avant l importance de la veille stratégique, les efforts engagés ne bénéficient qu aux entreprises sensibilisées dans les domaines en alerte, tels que par exemple l aéronautique, les télécommunications et l énergie, révélant ainsi la faible mobilisation d une large partie du secteur manufacturier. Deux freins majeurs s opposent encore à une large diffusion de la pratique de l intelligence économique. D une part, les deux fonctions «informatives» clairement identifiées par les entreprises - la protection de leur patrimoine industriel et la veille technologique - attestent d une conception partielle de l intelligence économique. En outre, cette veille axée sur l innovation et la commercialisation des produits s est développée au cours de deux dernières 34

37 Partie I - Chapitre 1 L intelligence économique décennies dans les grands groupes, mais demeure balbutiante dans l immense majorité des PME-PMI. D autre part, l ensemble des acteurs nationaux n a pas véritablement pris conscience que la compétitivité et la défense de l emploi dépendent aussi de la gestion stratégique de l information économique. Il en résulte une méconnaissance des mécanismes mis en oeuvre par les systèmes productifs offensifs, une évaluation floue des menaces et souvent un grave déficit d ajustement stratégique. L ampleur des mutations provoquées par la globalisation des marchés ne peut plus désormais être maîtrisée dans le cadre des organisations classiques. L appréhension des environnements complexes impose une révision des modes de réflexion et des comportements de l ensemble des acteurs économiques. A cet égard, plusieurs orientations de fond paraissent nécessaires. Les états-majors des groupes, comme les responsables de PME-PMI doivent désormais s impliquer dans la mise en oeuvre de l intelligence économique et avant tout formuler clairement leurs orientations, leurs besoins d information élaborée. La création d animateurs de la fonction d intelligence économique dans l entreprise doit accompagner la mise en place d une organisation flexible fonctionnant en réseau, la sensibilisation et l association des syndicats à l ensemble de ces réformes devenant un gage d efficacité. Situé au cœur du système d intelligence économique, l Etat doit jouer un rôle incitatif puissant dans ce domaine. Il devient indispensable que les administrations concernées, dans le cadre d un débat public, adaptent leurs missions aux nouveaux enjeux de la mondialisation des économies. Une telle réforme nécessite de la part de l Etat un décloisonnement de ses services, un renforcement des circuits publics d échanges d information aux réalités concurrentielles des marchés globalisés, afin d être en capacité de définir une vision stratégique globale et de mobiliser les acteurs économiques sur des priorités d actions définies en fonction des pôles multiples de l économie nationale. Les régions constituent aujourd hui l un des champs d action essentiels de la concurrence liée à la globalisation des échanges. L anticipation des menaces et des opportunités qui y sont liées pousse les acteurs locaux (collectivités, réseaux consulaires, associations de développement...) à la mise en place de dispositif collectif de gestion de l information utile. Dès lors, l intelligence économique devient un outil essentiel destiné à définir les priorités stratégiques adaptées aux nouveaux enjeux des régions et des entreprises, selon trois priorités constitutives de toute stratégie régionale efficace : 35

38 Partie I - Chapitre 1 L intelligence économique L intensification des actions de développement local, notamment en coordination avec d autres régions, L intensification de stratégies d alliances inter-régionales à l échelle européenne, La mise en place de réseau d appui à l export fondé sur la coopération entre les entreprises, les régions et les administrations nationales compétentes. De telles réformes doivent être conduites dans le même temps et sont indissociables de la définition d une politique stratégique nationale à long terme mobilisant la volonté claire, affichée par la puissance publique qui, seule, pourra donner l impulsion nécessaire Année 2003 : Bernard Carayon Le rapport de Bernard Carayon [CARAYON, 2003] au Premier Ministre Jean-Pierre Raffarin propose des réflexions autour de l intelligence économique selon cinq axes qui portent sur les acteurs et les champs de l intelligence économique, la compétitivité de la France, la révision de la politique d influence, la formation à l intelligence économique et l intelligence économique et les territoires. D après [CARAYON, 2003] l intelligence économique a fait l objet de multiples définitions d experts. Plusieurs des personnalités auditionnées ont souligné la confusion - entretenue par la double acception du mot intelligence entre intelligence économique et espionnage, et suggéré de changer d appellation. A la fois anglicisme et néologisme, «l intelligence économique» reste cependant une «marque» sur laquelle tout le monde s entend, faute d un autre choix crédible. Il sera fréquemment fait référence au «modèle américain» : modèle politique, modèle d Organisations administratives ou de comportements d entreprises. Le but de ce rapport n est évidemment pas de désigner un adversaire mais bien d attirer l attention sur les avantages d une doctrine affirmée, de pratiques assumées et de mesurer leurs conséquences dans les relations internationales économiques et politiques. L objectif de ce rapport n est pas d épuiser les problématiques des différents thèmes abordés ou de garnir les étagères des spécialistes. Dix années après la parution du rapport dit «Martre» du Commissariat Général au Plan [MARTRE, 1994b] intitulé «Intelligence économique et stratégie des entreprises», les acteurs, les points d application, les pratiques et le contenu même de l intelligence économique ont beaucoup évolué. Il est temps de redonner à celle-ci la dimension stratégique 36

39 Partie I - Chapitre 1 L intelligence économique qu elle perd parfois au profit de discours verbeux vantant les mérites de tel ou tel outil logiciel ou mode d Organisation. Il s agit, conformément aux termes de la lettre de mission du Premier Ministre, de proposer des mesures opérationnelles et des axes de travail. Certaines des propositions élaborées par la mission concernent plus directement l organisation de l Etat ou la mise en place de procédures spécifiques. Elles font l objet d un développement non publié Année 2004 : Alain Juillet Alain Juillet [ARPAGIAN, 2004a] est nommé haut responsable en charge de l intelligence économique auprès du Premier Ministre. Dans le cadre de la société de l information, l ancien numéro deux des services secrets français a pour mission de sensibiliser administrations et entreprises aux enjeux de l intelligence économique. Sa mission au sein du Secrétariat Général de la Défense Nationale, consiste à faire en sorte que les entreprises et les administrations françaises se préoccupent plus systématiquement de la manière dont elles peuvent tirer parti des technologies de l information dans un contexte de guerre économique. D après Alain Juillet 90% des données qui intéressent les entreprises pour leur développement sont librement accessibles. C est dans la collecte et le tri de ces matériaux à valeur ajoutée que les systèmes d information peuvent faire valoir leur utilité. Cela suppose une collaboration étroite de la direction des systèmes d information avec les autres départements de l entreprise. Sa fonction, confiée par le Premier Ministre Raffarin, à la suite du rapport Carayon, doit permettre d identifier tout ce qui se fait dans le domaine de l intelligence économique au niveau des administrations et des services de l Etat. Le but est d amener l ensemble des entreprises françaises à découvrir le concept, à le pratiquer, et à se l approprier. Il rappelle que l intelligence économique est la maîtrise et la protection de l information stratégique qui donne la possibilité aux chefs d entreprise d optimiser leur décision. Le responsable de l intelligence économique doit être proche de la direction pour en connaître les orientations et en rendre compte. Il doit être capable d identifier et d utiliser des moyens performants de veille, d analyse ou de protection. Les directions des systèmes d information jouent un rôle essentiel car il est impossible de faire de l intelligence économique performante sans un outil informatique très performant, capable d évoluer au gré des progrès techniques. Le marché est devenu mondial, le connaître implique de recueillir et de traiter très rapidement une énorme quantité de données. 37

40 Partie I - Chapitre 1 L intelligence économique Le concept d intelligence économique ne se réduit donc pas uniquement à la veille et à l analyse par des moyens informatiques. Le rôle de l Etat n est pas de se substituer aux sociétés mais de les aider à s approprier la démarche. Les grandes entreprises sont en mesure d œuvrer seule. Le problème se situe au niveau des petites et moyennes entreprises. Le ministère de l intérieur, l Agence pour la diffusion de l information technologique (Adit), les Agences régionales d information stratégique et technologique (Arist), l Association française pour le développement de l intelligence économique (Afdie) mettent en place un concept d intelligence territoriale. Alain Juillet [DELBECQUE, 2004] remarque que le concept d intelligence économique, inconnu en 2004, prend corps. Le phénomène est accentué par les jeunes générations qui baignent dans l informatique depuis l enfance. Ce qui n est pas le cas chez les plus âgés, même quand ils ont pris l habitude d utiliser les technologies de l information. Alain Juillet distingue la situation des administrations et celle des entreprises. Dans la fonction publique, les dirigeants sont en général convaincus que l intelligence économique peut être utile. C est beaucoup moins vrai à l échelon inférieur, où la détention d informations est avant tout une question de pouvoir. Les dirigeants croient donc moins aux vertus de l échange et du travail en réseau. Des présidents de grands groupes sont persuadés du caractère hautement stratégique de l intelligence économique. Nombre de managers ne rejettent pas le concept, mais voient d un mauvais œil l intervention de l Etat dans ce domaine. Ils se considèrent suffisamment grands pour s en occuper seuls. Ce qui peut être vrai pour les cinq cents sociétés françaises disposant d une taille critique pour cela, mais laisse de côté les quelques 2,3 millions de PME et PMI. Or, dans les secteurs technologiques notamment, ces structures plus petites peuvent engendrer des géants, voire de futurs leaders mondiaux. Quinze secteurs stratégiques ont été identifiés et classés confidentiels. Les autorités françaises ont décidé d y favoriser les efforts en intelligence économique des acteurs de l économie afin de les aider à se battre à armes égales sur le marché mondial. A l instar de ce que fait par exemple, le gouvernement des Etats-Unis, qui défend une pratique libérale en théorie, mais sait parfaitement, dans la pratique être protectionniste quand il s agit des intérêts nationaux. Par exemple, la France manque cruellement d outils informatiques d origine française ou européenne. Notamment de solutions en matière d extraction de données sémantiques ou vocales, d outils de traduction automatique ou de moteurs de recherche spécifiques. Maîtriser 38

41 Partie I - Chapitre 1 L intelligence économique cette chaîne technologique est indispensable pour la sécurité et l intégrité des transmissions dans le cadre du système d information. Des solutions sont à l étude pour faire évoluer le droit communautaire qui, par exemple, interdit, au nom des règles de la concurrence, que l Etat réserve une partie de ses dépenses à des petites entreprises, qui pourraient gagner en solidité. La création de fonds d investissement permettrait à des entreprises de financer de jeunes pousses détentrices de technologies innovantes. Au niveau de l enseignement de l intelligence économique, un programme contenant les éléments indispensables qui doivent être enseignés en formation initiale ou en formation continue est en cours d élaboration. Les universités, les écoles d ingénieurs et de commerce sont fortement encouragées à intégrer l intelligence économique comme une matière à part entière. Il ne peut y avoir de politique d intelligence économique sans système d information performant. Mais il ne faudrait pas cantonner l intelligence économique à des contraintes de système d information. Celui-ci n est qu un outil au service de la stratégie. Les directeurs des systèmes d information doivent saisir cette opportunité pour considérer leur mission comme transversale entre toutes les fonctions opérationnelles de l entreprise. Il n est pas sûr que les managers en charge du marketing aient totalement pris conscience de leur rôle à ce sujet. En ne réalisant pas que nous passons d une économie de la demande à une économie de la connaissance. A la question concernant la nomination d un monsieur intelligence économique dans les entreprises, Alain Juillet approuve uniquement si elle remporte l adhésion des cadres dirigeants. Il met en garde sur le fait qu il ne doit pas s agir d un poste fourre-tout et de tirer parti des leçons du passé qui ont permis d observer que qualité et développement durables ont constitué des notions qui ont souvent été galvaudées L Intelligence Economique par son processus Un processus de management stratégique Les entreprises [ARPAGIAN et TAVAILLOT, 2004] évoluent dans un environnement en complexification croissante. En outre, le développement hyperbolique des alliances, fusions, acquisitions et autres grandes manœuvres entrepreneuriales, accentue la difficulté de décryptage du réel capitaliste parce qu il dynamise la création de réseaux complexes d interrelations, d interdépendance et de coopétition. Cette évolution influence le processus 39

42 Partie I - Chapitre 1 L intelligence économique d acquisition d informations et, conséquemment, le mécanisme décisionnel : en effet, la compétitivité d une organisation et donc sa pérennité dépendant de plus en plus étroitement de sa capacité d adaptation et de sa vitesse de réaction dans un environnement complexe, il faut savoir l essentiel puis agir vite. Adaptabilité qui exige l anticipation à travers la surveillance systématique et rationalisée de l environnement global (on parle dès lors de vieille stratégique), puis la gestion «offensive» des flux d informations. Il faut considérer l environnement comme une variable stratégique en permanente reconfiguration et sur laquelle l entreprise peut agir, voire même contribuer à façonner, par la maîtrise de l information. Or, c est la fonction même de l intelligence économique que de traiter les données et les informations, de créer de la connaissance efficace. L une des définitions les plus récentes, formulée par Jérôme Dupré [DUPRE, 2002], l explicite adéquatement : «En tant que concept, écrit-il, l intelligence économique est une notion nouvelle qui englobe l ensemble des problématiques de sécurité de l information et qui inclut notamment sa protection, sa gestion stratégique à des fins décisionnelles ou des actions d influence au profit des entreprises ou des États. Elle est généralement présentée comme une démarche collective ayant pour objet la recherche offensive et le partage de l information dans le cadre d un mode d Organisation transversal. Elle s inscrit dans le nouveau paradigme de la guerre économique». On peut finalement la qualifier, premièrement, de système de surveillance de l environnement de l entreprise, et deuxièmement, d action sur celui-ci, afin de détecter les menaces et d exploiter les opportunités Le fondement : le cycle du renseignement L information désigne un processus : succession d actions par lesquelles on accroît son stock de données pour élaborer de la connaissance. L information concerne également le résultat du processus : c est-à-dire la valeur ajoutée. L information se définit comme tout élément ou signe qui peut être transmis ou stocké et qui participe de la représentation du réel. Chaque information possède des propriétés telles que : l origine, l itinéraire, la vitesse de circulation, la durée de vie. 40

43 Partie I - Chapitre 1 L intelligence économique La création d information constitue un processus continu visant à augmenter «l intelligence» de la réalité, c est-à-dire sa compréhension. Elle est représentable comme une dynamique spiralée fondée sur l apprentissage, donc la maîtrise de la nouveauté, du changement. Certains parlent à ce propos de métabolisation. En tout état de cause, c est un processus de transformation des données, ou plutôt d intégration dans une structure de sens, visant à alimenter une logique d action et de décision orientée par un but. Cette dynamique informationnelle est, en fait, ce que l on nomme habituellement le «cycle du renseignement». A cet égard, on peut certes affirmer que l information est la «matière première» du renseignement, et «qu un renseignement est une information élaborée, pertinente et utile, correspondant aux besoins de celui qui la reçoit». Mais dès lors, comment le distinguer de la connaissance, du savoir? En fait, le renseignement désigne «des connaissances de tous ordres sur un adversaire potentiel, utiles aux pouvoirs publics, au commandement militaire». Mais on peut aussi considérer que savoir (ou connaissance) et renseignement se recouvrent très largement, sauf à poser que l usage du second doit être réservé au domaine politico-stratégique et militaire. Dès lors, le cycle du renseignement peut aussi bien être un cycle de la connaissance. Le cycle de renseignement se déroule en quatre phases : l orientation générale, la recherche, l exploitation et la diffusion. Il constitue le support indépassable de l intelligence économique. Durant la première étape, les grands enjeux sont identifiés, et les besoins en renseignements définis en conséquence. Ce qui donne lieu à une planification de la collecte d informations, à l émission de demandes ciblées, ainsi qu à un contrôle régulier de la productivité des instances de recherche. Les besoins s expriment de manière ponctuelle ou sous forme d un catalogue de questions adressées aux unités de collecte par les organes d exploitation. La collecte ou recherche, se définit comme la période de recherche où sont identifiées et exploitées les sources d informations, ceci dans le cadre d une planification. L analyse, c est-à-dire le traitement ou l exploitation, compose l étape au cours de laquelle les données et informations passent à l état de connaissance à travers un processus systématique d évaluation, d interprétation et de synthèse destiné à élaborer des conclusions (articulées sur des éléments significatifs) répondant aux besoins de renseignements exprimés. 41

44 Partie I - Chapitre 1 L intelligence économique La diffusion est l acheminement des renseignements sous une forme appropriée (orale, écrite ou graphique) aux organes ayant exprimé la demande. Il s agit bien d un cycle dans la mesure où le renseignement obtenu permet d une part d orienter les besoins nouveaux en renseignements et, d autre part, de réévaluer constamment la connaissance obtenue en fonction de l évolution de l environnement Les fonctions du cycle du renseignement Selon Levet et Paturel [LEVET et PATUREL, 1996], que l on peut facilement suivre sur ce point, l intelligence économique le décryptage une fois réalisé se déploie dans 4 directions d action. Le schéma ci-dessous permet de compléter les schémas 1 et 2 par l expression des besoins : Collecte Sources d information Formelles Informelles Traitement Besoins Diffusion Action Récepteur Figure : Cycle du renseignement Il est donc question, à travers le cycle du renseignement, de dresser différentes cartes de l environnement, des relations concurrentielles, des réseaux informationnels (institutionnels ou non, formels ou informels), des réseaux d influence, des principaux acteurs (favorables ou défavorables). L intérêt de ces cartographies stratégiques est de décrypter pour agir. Si le management s arme naturellement d une approche en termes d intelligence économique, il ne faut néanmoins en aucun cas confondre cette dernière avec la veille stratégique. Toute forme de veille approfondie possède des aspects stratégiques. Rappelons que la veille n est que l une des composantes de l intelligence économique ; on distingue habituellement quatre types de veille : technologique, concurrentielle, commerciale, environnementale. Elles s articulent dans une certaine mesure sur les différentes forces concurrentielles de la matrice de Porter. Cette approche simplifiée permet d ordonner la pensée mais, le plus souvent, les différents types de veille s interpénètrent. Le cycle du renseignement se place dans une démarche itérative en quatre étapes : expression des besoins informationnels, collecte des données, traitement de ces données en vue de les transformer en informations 42

45 Partie I - Chapitre 1 L intelligence économique pertinentes et exploitables, puis diffusion aux destinataires selon le contexte et les contraintes d utilisation de chacun. La veille technologique La veille technologique qui est parfois appelée «veille scientifique et technologique» s intéresse aux acquis scientifiques et techniques, fruits de la recherche fondamentale et de la recherche appliquée. Elle concerne aussi les produits ou services, les procédés de fabrication. Elle suit l évolution des systèmes d information. Les prestations de service dans lesquelles le facteur image est très fort permettent d opérer une transition avec la veille commerciale. La veille commerciale La veille commerciale concerne les clients ou les marchés. Il s agit de prendre en considération l évolution des besoins des clients. A l heure du développement des techniques de fidélisation, la veille commerciale implique le suivi et l analyse des réclamations. Celle-ci s intéresse également aux fournisseurs. Cette veille se développe notamment dans les services achats. La recherche d informations est certes focalisée sur le coût des services, mais s intéresse également à différentes garanties. La veille environnementale Cette veille englobe le reste de l environnement de l entreprise. C est souvent en intégrant habilement les éléments de l environnement politique, social, culturel et juridique qu une firme pourra distancier ses concurrents. Selon le type d entreprise, la veille environnementale, encore appelée veille globale ou sociétale, sera axée sur des aspects différents de la vie économique. A ces notions de veille, on ajoute l analyse stratégique qui n exploite que des informations publiques, souvent inaccessibles du grand public. L intelligence économique peut éventuellement collecter des informations confidentielles, par des moyens qui ne sont tout de même pas forcément illicites. L intelligence économique [CIGREF, 2003] est une activité d ingénierie de l information s exerçant dans un contexte concurrentiel, avec une vocation offensive ou défensive selon la synthèse du CIGREF 4. La veille concurrentielle La veille concurrentielle analyse les concurrents actuels ou potentiels, les nouveaux entrants sur le marché, pouvant lier leur apparition à l émergence de produits de substitution. 4 CIGREF : Club Informatique des GRandes Entreprises Françaises 43

46 Partie I - Chapitre 1 L intelligence économique L information recueillie peut couvrir des domaines très larges comme la gamme des produits concurrents, les circuits de distributions, l analyse des coûts. L organisation et la culture d entreprise, l évaluation de la direction générale et le portefeuille d activités de l entreprise sont autant d indicateurs au service de la veille concurrentielle L Intelligence Economique par ses acteurs Annuaire de l intelligence économique Maurice Botbol et Isabelle Verdier [BOTBOL et VERDIER, 2004], directeur du groupe Indigo Publications, rédacteur en chef de la lettre Intelligence Online (sous forme papier ou électronique à est à l origine de l ouvrage : France Le Top 100 de l intelligence économique. Il sélectionne les experts qualifiés dans le domaine de l intelligence économique de sociétés privées, de structures de grands groupes industriels, d organismes publics ou parapublics, des principales associations et de certains établissements d enseignement supérieurs. Il en ressort que les experts sont pour environ un tiers des prestataires, pour un quart dans l appareil d Etat, la formation et les associations et pour le reste (plus de 40%) dans les entreprises, essentiellement du CAC Une place très importante est accordée aux réseaux, réseaux relationnels qui constituent un mode de fonctionnement privilégié de la communauté française de l intelligence économique. Maurice Botbol et Isabelle Verdier ont procédé par entrevues et questionnaires. La valeur ajoutée de cet ouvrage tient au parcours et la personnalité des experts relatés. On y trouve de nombreux détails biographiques sur les professionnels de l intelligence économique. Maurice Botbol éclaire les types d affaires traitées et les méthodes employées pour aider les entreprises clientes à mener à bien leur activité, prévenir des risques et dénouer des situations problématiques. Chaque société est présentée sous deux angles. Une fiche sur le dirigeant avec sa biographie détaillée, son profil, sa formation, son parcours professionnel, ses réseaux de relation, son approche de l activité de l intelligence économique et des renseignements auxiliaires. La société est présentée avec ses coordonnées, ses domaines d activité, ses champs d intervention, ses principaux clients. Sont indiqués des renseignements sur les données de 5 CAC 40 : Cotation Assistée en Continu 44

47 Partie I - Chapitre 1 L intelligence économique base, les chiffres d affaires ou budgets, le nombre de salariés, les informations sur les principaux responsables de l équipe. Des exemples de contrats sont traités ainsi que des cas concrets. L intelligence économique est un secteur où agissent des entreprises de natures, de tailles et spécialités différentes, où se côtoient anciens officiers du renseignement, anciens policiers ou gendarmes, mais aussi diplômés de sciences politiques, d H.E.C. 6, économistes professionnels du droit, de la finance, ingénieurs télécoms et bien d autres spécialistes. Maurice Botbol et Isabelle Verdier permettent de rendre compte de cette diversité. Nous présentons le résultat de leur étude par un tableau où figurent certaines sociétés, leur date de création, leur chiffre d affaires. Les noms des dirigeants et les domaines d intervention permettent de profiler les acteurs de l intelligence économique par rapport à des thématiques. Société Date de création Dirigeant Chiffre d affaires Domaine d intervention ADIT Depuis 2003, société anonyme à capitaux d Etat Société américaine Kroll Société française Egideria Société BD consultants Plus grosse société d intelligence économique et la plus ancienne sur un plan mondial Expert d information grise offensive. Création 2001 Dirigeant Philippe Caduc (38 ans) Dirigeant français Olivier Zany. Les autres dirigeants : un ancien militaire issu du renseignement hollandais, un ancien de l armée israélienne, Dirigeant Yves- Michel Marti de formation ingénieur télécom Bruno Delamotte, exanalyste au Secrétariat Général de la Défense Nationale GEOS Création 1997 Dirigeant Stéphane Gérardin, ancien du service action de la DGSE 7 6 millions de chiffre d affaires Grosse partie du chiffre d affaires réalisée avec des clients français 75% de son chiffre d affaires réalisé à l étranger Plus de 5 millions de chiffre d affaires Création d une fondation d entreprises tournant autour des technologies de souveraineté Recours à Kroll dans le cas d affrontement entre poids lourds de l économie française Recherche reposant sur réseaux humains. Clientèles : grands groupes Interventions au profit de grands groupes. Société spécialisée en sécurisation des projets et implantations en zones sensibles. Repose sur un précieux réseau de contacts en France et à l étranger. Prestation de sécurité, comme la sécurité d installations pétrolières 6 HEC : Ecole des Hautes Etudes Commerciales 7 DGSE : Direction générale de la sécurité extérieure 45

48 Société Eurodécision-AIS juin 2001 Dirigeant Philippe Darentière AB Associates Depuis 1994 Dirigeant Alain Bauer Créatis Consulting Atlantic Intelligence En 1993 Dirigeant Stéphane Malvoisin, ancien de la DGSE Dirigeant Philippe Legorjus, ancien patron du GIGN 8 FLA Consultants Créé en 1977 Dirigeant François Libmann. Création du métier de courtier en information en France Partie I - Chapitre 1 L intelligence économique 5 millions de francs de chiffre d affaires Gestion des conflits et des crises Spécialisée dans la sécurité urbaine Spécialisée dans le risque voyageur 5,1 M de chiffre d affaires Société de conseil en sécurité/sûreté, Intelligence économique et communication de crise Spécialisé dans les sources d information électroniques en général : banques de données hébergées sur les serveurs professionnels, Internet, Web invisible. Cybion Depuis 1996 Dirigeants Carlo Revelli et Joël de Rosnay Spécialisé dans la veille stratégique sur Internet. Répond aux besoins informationnels des décideurs, en identifiant et en synthétisant l information stratégique destinée à un processus opérationnel Datops 5 M Société spécialisée dans le Digimind datamining Société spécialisée dans le datamining Antee S.A.S. Pierre Cabanes Surveillance de l évolution du droit et des réglementations dans le monde entier pour prévenir des risques possibles I2F Création 2000 Dirigeant Hervé Seveno, ancien de la brigade financière et la police judiciaire 70% du chiffre d affaires réalisé avec des entreprises du CAC 40 Société spécialisée dans le risque pénal. Ambition : créer un véritable pôle sécurité et intelligence économique Tableau : Données signalétiques autour de quelques acteurs de l intelligence économique à partir de l ouvrage de Maurice Botbol et Isabelle Verdier Les notices biographiques montrent comment les itinéraires professionnels des acteurs sont significatifs dans les stratégies mises en place au service de l intelligence économique Les entreprises et l intelligence économique Pour Maurice Botbol, la fonction d intelligence économique est encore mal assumée. Les entreprises sont rares à dire qu elles ont un responsable intelligence économique. Toutefois il mentionne de grands groupes qui enrichissent le secteur de l intelligence économique : Air 8 GIGN : Groupe d'intervention de la gendarmerie nationale 46

49 Partie I - Chapitre 1 L intelligence économique France, Bouygues, EADS, Giat Industries, Accor, LVMH, BNP-Parisbas, Danone, Renault, Saint-Gobain, Snecma, FranceTelecom, Total Thales, Thomson, Vivendi Universal, Lafarge, Lagardere, Dassault Aviation, Michelin etc L intelligence économique et l appareil d Etat Maurice Botbol constate une éclipse du «renseignement extérieur». Pour lui, la DGSE, c està-dire ceux qui devraient être aux avant-postes avec les Finances et les Affaires Etrangères ne font pas d intelligence économique. La DREE 9 ne joue pas un rôle important dans l intelligence économique. Maurice Botbol évoque les limites de la diplomatie d influence, parce que les Affaires Etrangères doivent appuyer les entreprises à l export, mais on est très loin de ce qui est fait dans les pays anglo-saxons pour obtenir les contrats. En revanche, on note une montée en puissance du Ministère de l intérieur qui a pris beaucoup d importance dans l intelligence économique. L actuel patron de la DST 10 a fait de l intelligence économique un des axes majeurs. La nomination d Alain Juillet donne la légitimité à l intelligence économique. Il en ressort que les professionnels de l intelligence économique ont des profils très divers que ce soit du monde du renseignement ou des profils de conseil en stratégie. Le rapport Carayon et la nomination d Alain Juillet contribuent à donner un essor à ce domaine encore nouveau en France. La France a du retard en ce domaine mais nombre de formations de qualité existent en intelligence économique. Des démarches intéressantes sont en cours, on l observe en termes d intelligence économique territoriale et de développement de réseaux d experts Acteurs de l intelligence économique en France Nicolas Arpagian [ARPAGIAN, 2004a] constate également qu il est difficile d établir un profil type des acteurs de l intelligence économique. Les principaux acteurs de l intelligence économique sont avares d informations sur leurs clients et réalisations. Ils mettent plutôt en avant leurs états de services antérieurs. On retrouve sur ce marché des anciens des services de renseignement, des militaires en phase de reconversion. On constate une évolution des professionnels de l intelligence économique. En attendant, Nicolas Arpagian classifie les poids lourds de l intelligence économique en quatre classes : les universitaires, les consultants, les institutionnel et les entrepreneurs. Pour exemple, voici de façon non exhaustive un certain nombre de personnalités citées que nous avons complétées par des 9 DREE : Direction des relations économiques extérieures 10 DST : Direction de la surveillance du territoire 47

50 Partie I - Chapitre 1 L intelligence économique professeurs des Universités de Nancy. Ces personnalités sont classifiées par secteurs d intervention de l intelligence économique en quatre classes selon les universitaires, les consultants, les institutionnels et les entrepreneurs. Amos David Odile Thiéry Maryse Salles Les Universitaires Nom Profession Fonctions Amiral Pierre Lacoste [LACOSTE et THUAL, 2002] Christian Harbulot Professeur des Universités, Nancy 2 en SIC Professeur des Universités, Nancy 2 en informatique Maître de conférences Toulouse 1 en SIC Enseignant à l Université de Marnela-Vallée Directeur de l Ecole de guerre économique Responsable scientifique SITE-LORIA Directeur des études du DESS-IST-IE créé en 1988, Master PRO spécialité IE Responsable permanent équipe SITE-LORIA, directrice UFR MI Nancy 2 et service commun du Pôle Lorrain de Gestion, spécialité SIS Enseignant-chercheur en conception des systèmes d aide à la décision et en système d information Après une carrière militaire qui l a conduit à la tête de la DGSE, il a opté pour le monde académique en collaborant au Centre d études scientifiques de la défense de l Université de Marne-la-Vallée Enseignant et consultant. A collaboré à l écriture du rapport Martre Tableau : Liste non exhaustive de la classification des secteurs d intervention de l intelligence économique pour les universitaires. Michel Besson Les Consultants Nom Profession Fonctions Philippe Legorjus Editeur «Regards sur l intelligence économique» Président Atlantic intelligence Fondation du bureau européen d informations commerciales (BEIC) Ancien commandant du GIGN a fondé ce cabinet spécialisé dans les environnements instables. Conseiller de la moitié des entreprises du CAC40 dans le domaine de la sécurité et des systèmes d information Ancien officier supérieur de l armée de terre. Spécialisé dans l intelligence économique et la gestion de crise. Général Loup Francart Cabinet Eurodécision- AIS Olivier Darrason Président cabinet CEIS 11 Connaisseur de la machinerie militaire. Un des principaux acteurs privés de l intelligence économique à la française Dominique Fonvielle Cabinet Conseil et Ancien colonel de la DGSE. Collabore aux travaux de l AFDIE 12 informations stratégiques François Libman Président SCIP 13 France Fondateur du cabinet FLA consultants. Bon connaisseur de la gestion des sources d information électroniques Tableau : Classification des secteurs d intervention de l intelligence économique pour les consultants. Les Institutionnels Nom Profession Fonctions Bernard Carayon Député-maire de Lavaur Prise en compte dans le débat économique de la question de l intelligence économique suite au rapport publié en juillet Suggestion de la création du poste interministériel de Bernard Besson Alain Juillet Contrôleur général, ministère de l intérieur Haut responsable en charge de l intelligence économique, SGDN 14 haut responsable en charge de l intelligence économique Travail sur les enjeux de l intelligence économique. Adaptation au monde de l entreprise des méthodes d investigation et d analyse des services de renseignement en toute légalité Monsieur Intelligence Economique au sein du gouvernement. Mise en place d une réelle politique d intelligence économique. 11 CEIS : Compagnie Européenne d Intelligence Stratégique 12 AFDIE : Association française pour le développement de l intelligence économique 13 SCIP : Society of Competitive Intelligence Professionals 48

51 Partie I - Chapitre 1 L intelligence économique François Asselineau Rémy Pautrat Délégué général en charge de l intelligence économique, ministère de l Economie et des Finances Vice-président exécutif de l Adit Mission de structurer les actions relatives à l intelligence économique au sein du ministère de l Economie et des Finances Approche territoriale de l intelligence économique. Il œuvre pour que les entreprises et les PME se dotent d une stratégie en matière d intelligence économique Tableau : Classification des secteurs d intervention de l intelligence économique pour les institutionnels. Les Entrepreneurs Nom Profession Fonctions Philippe Clerc Directeur de l intelligence économique, de A participé à la rédaction du rapport Martre. Il coordonne les politiques menées par les chambres de commerce en ce qui concerne l intelligence économique l innovation et des TIC à l ACFCI 15 Robert Guillomot Président IDEE Un des pionniers de l intelligence économique en France. Dirige la société Alogic, éditeur de solutions logicielles. Thierry Dassault Président Dassault Multimédia Il a formalisé son engagement dans l intelligence économique en organisant un tour de table français pour financer un acteur européen dans le domaine des infrastructures de gestion de clés. Daniel Naftalski Medef Publication de trente-cinq propositions patronales en faveur de Ludovic Emanuely Jean-François Pépin Animateur groupe La Fontaine Directeur général du Cigref l intelligence économique Association de responsables intelligence économique appartenant à vingt-cinq grands groupes issus de tous les secteurs d activité Professeur à l Institut d administration des entreprises IAE de Paris. Sensibilisation à l intelligence économique des DSI de grands groupes français Tableau : Classification des secteurs d intervention de l intelligence économique pour les entrepreneurs Intelligence économique et directeur des systèmes d information L article [ARPAGIAN, 2004b] fait l analyse de l ouvrage : France - top 100 de l intelligence économique et mentionne huit règles d or pour l intelligence économique. Ces huit règles d or tournent autour des concepts clés de l intelligence économique, à savoir interlocuteur, valeur ajoutée, transversalité, besoin, application, pérennité, veille et anticiper. Voici détaillées, les huit règles d or : 1. Travailler en tandem. Identifier l interlocuteur responsable à la tête de la cellule d intelligence économique, de veille ou de gestion de l information qui exprime clairement un besoin. 14 SGDN : Secrétariat général de la défense nationale 15 ACFCI Assemblée des chambres de commerce et d industrie 49

52 Partie I - Chapitre 1 L intelligence économique 2. S assurer du soutien de la direction générale. Montrer que le système d information est créateur de valeur et pas seulement un centre de coût. 3. Adopter une vision transversale pour sensibiliser les directions opérationnelles d un projet. 4. Ne pas confondre le contenu et la technique. Aider les utilisateurs à formuler un besoin sans se substituer à eux. 5. Laisser mûrir le projet d intelligence économique et prendre le temps de bien évaluer les applications. 6. S assurer de la pérennité d une prestation technique. 7. Assurer la veille. 8. Savoir anticiper. Faire converger les outils de gestion documentaire, de recherche avec des solutions de business intelligence, sans créer des usines à gaz Intelligence économique socle de la compétitivité des entreprises Un décret [ARPAGIAN, 2004a] signé par le Président de la République et le Premier Ministre Raffarin formalise une prise de conscience chez les gouvernants que la France doit être plus active dans le domaine de l intelligence économique. En désignant dans les services de l Etat des équipes spécialement chargées de travailler sur la question de l intelligence économique, les pouvoirs publics tiennent à exprimer le caractère hautement stratégique de la veille et de la protection du patrimoine technologique. La réalité de la guerre économique témoigne de l âpreté de ces nouvelles formes de concurrence, qui exigent une maîtrise accrue des systèmes d information. L intelligence économique n est pas une mode, mais le socle de la compétitivité des entreprises, et la condition de leur survie dans un contexte de concurrence mondiale. Pendant longtemps, l intelligence économique n a concerné que les états-majors et n a porté que sur des décisions stratégiques. Elle implique à présent la plupart des acteurs de l entreprise. Pour cela, il s agit de bien exploiter l information pour identifier et minimiser les risques financiers, juridiques, surveiller la concurrence et décider en toute connaissance de cause. Cette démarche passe par un système d information performant. Jean-François Pépin, délégué général du Cigref 16 exprime son analyse de la façon suivante : «L intelligence économique d entreprise est une affaire de culture managériale. C est-à-dire une volonté singulière de penser, de décider et de coopérer afin de mieux agir collectivement. Dès lors, la Direction des systèmes d information est elle-même concernée au premier chef. Et nous 16 CIGREF : Club informatique des grandes entreprises françaises 50

53 Partie I - Chapitre 1 L intelligence économique préconisons qu elle serve d exemple aux autres métiers de l entreprise». Business intelligence, knowledge management, GED 17, veille, travail collaboratif sont des pratiques qui contribuent à l intelligence économique. L intelligence économique peut être une attitude de l entreprise, elle peut être offensive pour saisir les opportunités-clés. Elle peut être aussi défensive. Cette démarche exige de nouvelles compétences plus axées sur le management des hommes et de l information que sur la seule gestion d un budget, d infrastructures ou de choix technologiques L Intelligence Economique par ses outils Le moteur de recherche [QUESTER, 2004] est au cœur de la plate-forme intelligence économique. Il est un élément d une chaîne de valeur, qui consiste à collecter et extraire de la donnée pour la transformer en information. Information qui va permettre d optimiser la prise de décision. On distingue trois catégories d applications que nous allons développer : 1. Les outils de recherche, 2. Les outils de traitement, 3. Les outils de diffusion Les outils de recherche comprennent en outre : les moteurs de recherche, les métas moteurs et les agents intelligents. Les outils de traitement regroupent les applications pour : traiter les données collectées, conférer du sens aux données collectées, faciliter leur lecture, les trier, et les classer en catégories pertinentes. Les outils de diffusion et de partage permettent de communiquer les bonnes informations aux bons interlocuteurs et de capitaliser les connaissances. L intelligence économique ne se cantonne pas aux activités de veille et de recherche d information. Elle s étend à l analyse, à la gestion des connaissances, à la publication de rapports ou de notes, et au travail collaboratif. Les frontières entre la veille, la GED et la gestion des connaissances tendent à s estomper. Les acteurs, qui couvrent la chaîne de la valeur de l intelligence économique, sont spécialisés dans une ou plusieurs briques. Le tableau ci-dessous illustre la couverture de la chaîne de la valeur de l intelligence économique par un certain nombre d éditeurs. Cette liste n est pas exhaustive et est en constante évolution. Elle est la représentation à un temps T des catégories d application recherche, traitement, gestion des connaissances, conseil. L item «recherche» signifie le processus de collecte d information et des possibilités d alerte à destination de l utilisateur. Le «traitement» 17 GED : Gestion Electronique des Documents 51

54 Partie I - Chapitre 1 L intelligence économique concerne les capacités d analyse et de représentation de l application des informations trouvées. La rubrique «gestion de connaissances» place l application à un niveau collectif où les informations peuvent être diffusées et partagées. L item «conseil» oriente la prise de décision : cet aspect est faiblement représenté au niveau des applications. Recherche Traitement Gestion des connaissances Conseil Collecte Alerte Analyse Représentation Diffusion Partage Partage Alogic Oui Oui Oui Oui Oui Oui Oui Arisem Oui Oui Oui En partie Oui Oui Oui Bea Conseil Non Oui En partie Non Non Non En partie Datops Oui Oui Oui Oui Oui En partie Oui Digimind Oui Oui Oui Oui Oui Oui Oui Exalead Oui Oui En partie Non En partie En partie Non Go Albert Oui Oui Oui En partie En partie Non Non Kartoo Oui Oui En partie Oui Oui Non Non Knowings En partie Oui En partie Non Oui Oui Oui Lingway Oui Oui Oui En partie Oui Non Non Ltu Oui Oui Oui Non Non Non Non Technologies Pertimm Oui Oui Oui Non Non Non Non Sinequa Oui Non Oui Non Non Non Temis Oui Oui Oui Oui Non Non Non Tableau : Représentation des catégories d application de certains éditeurs d outils utilisés en intelligence économique à partir du Journal du Net. Création Clients Chiffre Coût licence d affaires Alogic 2000 EDF, Ministère de l Agriculture et de la Pêche, Education Nationale, Journal Quotidien Régional (France), Zetascribe, France Telecom, Pearson Education (USA), 112 M en 2004 Sagebrush (USA), Collectif des Publishers (USA) Arisem 1996 Thales, Total, Sanofi, DGA, Région Lorraine, EADS, Cnes 2 et 2,5 M De 8000 à Bea Conseil 1995 Eurocopter, IFP, Pfizer, Ministère de la Défense 0,6 M A partir de 2000 Datops 1995 Air France, Axa, Michelin, Snecma, Thales, Total 6 M De à plus de 1 M Digimind 1998 Sanofi-Aventis, EADS, DGA, Roche Pharma, Scor, Total 1 M A partir de Exalead 2000 DST, Fromageries Bel, Inria, Gide Loyrette Nouel 3 M De à Go Albert 1999 Air France, CCIP, Coface 1,4 M De 8000 à Kartoo 2001 ONU, L Oréal, BNP Parisbas, Ubisoft 1,2 M A partir de Knowings 1999 CCI Grenoble, GDF, Fédération de la plasturgie 1,4 M A partir de pour global Finder Lingway 2001 CNRS, Inpi, Office européen des brevets, EADS 1,7 M A partir de Ltu Technologies 1999 FBI, Inpi Plusieurs millions d euros De à Pertimm 1997 ANPE, CNRS, Vedior Bis 0,5 M A partir de 5000 Sinequa 1984 AMF, CEA, SNCF, EDF, Ministère de la défense et de l intérieur 2 M A partir de Temis 2000 Total, Ipsen, TIM, Hachette Filipacchi, 1,5 M A partir de DaimlerChryler Tableau : Données signalétiques autour des éditeurs d outils utilisés en intelligence économique à partir du Journal du Net 52

55 Partie I - Chapitre 1 L intelligence économique La demande des clients évolue vers des solutions complètes qui balaient tout le spectre fonctionnel de l intelligence économique. Conscients, les éditeurs français développent les fonctionnalités qui font défaut à leurs produits et multiplient les partenariats avec les acteurs possédant des briques complémentaires de leurs solutions L Intelligence Economique par l équipe SITE- LORIA L équipe SITE du LORIA (cf rapport d activité du LORIA [LORIA, 2005]) a été créée en 2001 par le Professeur Amos David, précurseur en recherche en Intelligence Economique à Nancy et le Professeur Odile Thiéry, professeur d informatique est une des équipes du LORIA qui signifie Laboratoire Lorrain de Recherche en Informatique et ses Applications. L appartenance de l équipe au LORIA symbolise que le fruit des recherches de l équipe SITE favorise l émergence d applications y compris informatiques. La problématique de l équipe SITE [LORIA, 2005], dont l intitulé exact est Modélisation et Développement de Systèmes d Intelligence Économique, est d étudier la modélisation et le développement de systèmes d informations stratégiques dans le cadre de l Intelligence Economique. Pourquoi avoir choisi le nom symbolique «SITE»? Les fondateurs de l équipe donnent trois sens du mot SITE dans trois domaines qui sont : l environnement, l archéologie et la biologie. Dans le domaine de l environnement, le mot signifie un lieu, tel qu il s offre aux yeux de l observateur ; paysage, envisagé quant à sa beauté. Par exemple un site classé, officiellement protégé. Il signifie aussi une configuration, envisagée du point de vue pratique, économique, du lieu où est édifiée une ville. En archéologie, il représente un lieu où se trouvent des vestiges. En biologie le mot signifie une partie d un gène séparable des éléments voisins et susceptible, en cas de modification, de produire une mutation de l organisme. En informatique, il évoque un site Internet. Les mots-clés qui caractérisent le projet de recherche de l équipe, sont la notion d observateur, de protection du patrimoine «information» et la notion d «évolution» par mutation. Elles mettent en évidence le rôle des «acteurs» dans un contexte socio-économique, l information en constitue un outil de pilotage et fait l objet d une protection toute particulière. L exploitation de cet ensemble - 53

56 Partie I - Chapitre 1 L intelligence économique «information» «acteurs» «évolution» - permet de gérer et de définir les stratégies de développement des organismes socio-économiques. Plusieurs axes de recherche sont à l étude au sein de l équipe : Modélisation de l utilisateur-acteur, Modélisation de l interaction entre l utilisateur et le médiateur, Conception d entrepôts de données, Prise en compte de l utilisateur dans la construction de bases métiers, Recherche collaborative d information pour la décision, Définition de métas données intégrant le modèle de l utilisateur. I.6.1 Modélisation de l utilisateur-acteur L objectif de cet axe de recherche est de permettre la prise en compte des particularités des acteurs dans le processus d intelligence économique par la modélisation de l utilisateur. Il s agit de proposer des modèles et des méthodes permettant de produire des résultats aussi pertinents que possible par le système, en réponse au besoin en information (de quelque nature que ce soit) de l utilisateur. Ceci dans un contexte classique de recherche d informations mais aussi dans un contexte de systèmes d information stratégiques où le concept de data-mart 18 correspond à cette modélisation de l acteur final du système, par exemple le directeur pour qui un tel système est indispensable à une bonne prise de décision. Décideur Compétences Interprétation des indicateurs Paramètres de calcul des indicateurs Utilisateur (Acteur) Veilleur Compétences Connaissance du domaine Identification des sources pertinentes Techniques de recherché d information Mise en forme de l information Validation de l information Calcul des indicateurs Figure : Utilisateur - acteur dans l environnement de l entreprise 18 Data-mart : base métier 54

57 Partie I - Chapitre 1 L intelligence économique Les méthodes à la base des techniques de personnalisation des réponses reposent sur la notion de pertinence. La pertinence d une solution est souvent mesurée par rapport à la requête de l utilisateur. Comme la requête ne représente pas forcément le besoin en information de l utilisateur, l utilisateur juge la pertinence de la réponse par rapport à son besoin, ce qui ne correspond pas à la mesure de pertinence par le système. La technique qui consiste en l évaluation des propositions du système pour indiquer leur degré de pertinence est intégrée dans certains systèmes de recherche d information. Le système dispose ainsi des connaissances sur l adéquation des réponses du système au besoin de l utilisateur. Néanmoins, le système ne connaît réellement ce besoin, que par une estimation fondée sur les requêtes. Au lieu de calculer ce besoin, il est possible d en intégrer la représentation dans le modèle de l utilisateur, ce qui constitue l originalité de cette proposition. Cela revient dans un système d information stratégique à stocker parmi les métas données du système une représentation explicite de la structure des différents data-marts. Cet axe de prise en compte de l acteur dans la construction puis l exploitation d entrepôts de données est un domaine majeur des recherches de l équipe. En effet actuellement rien n existe vraiment dans le domaine, ni dans les systèmes d entreprises (y compris dans les outils de CRM 19 ou de personnalisation du e-business), ni dans les recherches en cours sur les systèmes d informations stratégiques. I.6.2 Modélisation de l interaction entre l utilisateur et le médiateur L objectif de cet axe est de proposer des modèles d interaction entre un utilisateur et un médiateur ou entre deux utilisateurs. En relation avec la modélisation de l utilisateur, la problématique de cet axe concerne la détermination des statuts et les connaissances des coopérants. Dans un contexte d Intelligence Economique, la prise en compte du statut d un collaborateur est indispensable car il est nécessaire de vérifier sa compétence et le degré de confiance que l on peut lui attribuer. Ce dernier point montre la relation des études en modélisation de l utilisateur et le travail collaboratif. L équipe SITE compte se référer d une part, aux résultats des études sur la protection du patrimoine, en particulier le concept de désinformation, et d autre part aux résultats des études sur les interactions entre les usagers des centres de ressources en information. 19 CRM : Customer Relationship Management 55

58 Partie I - Chapitre 1 L intelligence économique La spécificité de cet axe porte sur l introduction du concept de communication interpersonnelle qui implique deux utilisateurs dans un système de recherche d information. Les résultats de cet axe permettront le partage des connaissances d un domaine ainsi que les compétences des intervenants humains. La communauté de sciences de l information et de la communication est très intéressée par les études de cet axe, car les résultats permettront d expérimenter la communication interpersonnelle dans un contexte précis de recherche d information. Il y a actuellement les forums de discussion et les chats mais ces outils ne permettent pas la coordination du dialogue et du processus de résolution de problème. I.6.3 Conception et exploitation d un entrepôt de données L objectif de cet axe est de proposer une architecture, un modèle, une démarche permettant de concevoir un système d information stratégique de qualité et répondant aux besoins des différents acteurs de l organisation. Cet axe rejoint le problème de modélisation de l utilisateur ou du «client» au sens large. D autre part les outils actuels du marché (les plus connus étant Cognos et Business Object) proposent non seulement de construire le cube multidimensionnel c est-à-dire la vue multi couches et dans l espace des données de l entrepôt (et par là d extraire les données nécessaires à son alimentation) mais aussi de l exploiter intelligemment c est-à-dire qu ils permettent une extraction de connaissance (essentiellement par des outils EIS executive information system). L expérience l a prouvé, ces logiciels, bien que reposant sur un module de data mining relativement élémentaire, permettent déjà de découvrir des règles et des concepts qui n ont pas encore été mis en évidence. En ce sens, ils sont supérieurs aux simples tableurs et outils statistiques qui permettent essentiellement de répondre à des questions dont on ne connaît pas la réponse exacte mais dont on est capable de supputer l idée. Il faudrait rajouter ici un module qui fasse de l extraction de données réelle, afin d améliorer les fonctionnalités de ces outils à deux niveaux : au niveau de l extraction des données pour construire l entrepôt et au niveau de l exploitation de la base de données multidimensionnelles. Un autre objectif, à partir des travaux de l équipe SITE qui ont été réalisés dans le cadre de DRT SIO 20, est de mettre en place des outils permettant de vérifier, même a posteriori la qualité des données de l entrepôt. Pour l instant les travaux sont focalisés sur la construction de l entrepôt et des bases métiers à partir de sources de données hétérogènes. L idée est de trouver automatiquement la méta base de l entrepôt et d y adjoindre des métas données sur l utilisateur. 20 DRT SIO : Diplôme de recherche technologique système d'information des organisations 56

59 Partie I - Chapitre 1 L intelligence économique Dans le domaine des entrepôts de données, la gestion des risques est considérée comme axe de gestion de projet. Les travaux de l équipe SITE permettent de dire qu il vaut la peine de tenir compte d elle à chaque étape du processus global d intelligence économique. Pour énumérer des situations potentiellement à risque, dans des étapes d intelligence économique, il est proposé d analyser ces étapes à l aide du triplet «utilisateur - l information processus» comme stratégie pour identifier des risques, et il est adopté une double approche : de façon structurelle et dynamique. Au niveau structurel, un ajout des métas données à l entrepôt, qui sont spécifiques à la gestion des risques. Au niveau dynamique, les interactions entre l utilisateur et le système sont raffinées en ajoutant des règles de détection et de gestion de risque. Le but est de concevoir un entrepôt «risque-averti» de données au-dessus de son cycle de vie entier, à savoir : conception exploitation (et surveillance), et utilisation par des utilisateurs. I.6.4 Modélisation et développement de systèmes d intelligence économique Les réflexions de l équipe SITE ont abouti à l identification de huit étapes dans le processus d intelligence économique : 1. Identification d un problème décisionnel 2. Traduction du problème décisionnel en problèmes de recherche d information 3. Identification et validation des sources d information 4. Collecte et validation des informations 5. Traitement des informations pour obtenir des informations à valeur ajoutée 6. Présentation de l information 7. Interprétation des informations 8. Décision Une mise en correspondance entre le processus d intelligence économique et les acteurs de l intelligence économique permet d indiquer l implication des acteurs selon les différentes phases précédemment citées. On peut par le tableau ci-dessous remarquer le recours ou non à des outils informatiques. Enfin, en quatrième colonne, ce tableau facilite la visualisation des phases d intervention de ce présent travail de recherche que l on situe en phases : 3) Identification et validation des sources d information 4) Collecte et validation des informations 5) Traitement des informations pour obtenir des informations à valeur ajoutée 57

60 Partie I - Chapitre 1 L intelligence économique 6) Présentation de l information 7) Interprétation des informations Phase Acteur Outils informatiques Contributions de notre thèse 1) Identification d un problème décisionnel Décideur Non 2) Traduction du problème décisionnel en Décideur + Veilleur Oui problèmes de recherche d information 3) Identification et validation des sources Veilleur Oui Oui d information 4) Collecte et validation des informations Veilleur Oui Oui 5) Traitement des informations pour obtenir Veilleur Oui Oui des informations à valeur ajoutée 6) Présentation de l information Veilleur Oui Oui 7) Interprétation des informations Décideur Non Oui 8) Décision Décideur Non Tableau : Situation de nos travaux de recherche par rapport à la modélisation processus de l intelligence économique élaborée par l équipe SITE-LORIA La modélisation du processus de l intelligence économique met en relief les composants d un système d information. Nous nous attachons à l utilisateur final pour mettre en relation composants de l information, activités et exploitations de recherche d information. Depuis 2001, l équipe s est enrichie de nombreux chercheurs. Si les travaux ont en commun la prise en compte de l utilisateur dans les systèmes d information dans un cadre d intelligence économique, ils sont spécifiques dans leur recherche, leur apport et leur contribution dans ce cadre représenté par la Figure Au fil des ans, plusieurs modèles sont nés pour refléter les problématiques de l équipe SITE. Décideur / Utilisateur MEPD RUBI 3 Mise en correspondance Modèle EQuA 2 te Modèle WISP Veilleur / Spécialiste en RI Modèle WISP Base d information Modèles de représentation Veilleur / Spécialiste en RI MIRABEL Le monde de l information Information multimédia Sélection Modèle WISP Veille Annotation RAPC Entrepôt de données / Base métier Analyse EQuA 2 te Information à valeur ajoutée Interprétation Décideur MEPD Décision Figure : SITE - L IE et les composants des systèmes d information : notre modèle 58

61 Partie I - Chapitre 1 L intelligence économique Tout d abord le modèle EquA 2 te 21, puis MEPD 22, WISP 23, MIRABEL 24 et enfin notre modèle 25 RUBI 3 propre à la représentation de l utilisateur au sein d un SIS universitaire notre modèle sera explicité en Partie II et amélioré en Partie III. L équipe SITE travaille à l élaboration d une plate forme d analyse METIORE qui permet d évaluer les résultats de la recherche de l équipe. I.6.5 Logiciel METIORE METIORE est un système qui permet entre autres l analyse de notices bibliographiques. Il permet d intégrer les fonctionnalités exprimées par le modèle EquA 2 te. Ce logiciel qui recense les publications du LORIA depuis 1980, permet de faire des analyses bibliométriques comme par exemple, observer les co-auteurs de publications selon une tranche de temps. Il apporte une valeur ajoutée dans sa possibilité de représentation graphique des informations, comme la fréquence de mots-clés employés dans des articles autour des systèmes experts, selon le schéma ci-dessous : Figure : Mise en perspective de l information trouvée à partir de METIORE 21 EquA 2 te : Explore Query Analyse Annote 22 MEPD : Modèle pour l'explicitation d'un problème décisionnel 23 WISP : Watcher-Information-Search-Problem 24 MIRABEL : Model for Information Retrieval query Annotations Based on Expression Levels 25 RUBI 3 : Représentation des Utilisateurs et de leurs Besoins en Information lors de l Interrogation après Identification. 59

62 Partie I - Chapitre 1 L intelligence économique Les derniers résultats de l équipe SITE témoignent de l évolution des thématiques de recherche : compréhension de problème décisionnel, représentation des activités d intelligence économique, fonctionnalités caractéristiques d un système d intelligence économique, gestion de projets et services en intelligence économique, représentation des connaissances, administration des bases de données, conception d entrepôt de données, adaptation d un entrepôt de données. Et, donc, nous nous plaçons au niveau de la représentation des activités, du système d intelligence économique, de la conception d entrepôt de données, et de l adaptation d un entrepôt de données. A présent en 1.7 et 1.8 nous cherchons à exploiter les informations trouvées par l analyse de liste de diffusion et une analyse bibliométrique pour notre état de l art. Nous voulons faire émerger des concepts relatifs à nos travaux de recherche pour guider la stratégie de notre étude L Intelligence Economique par le dépouillement de listes de diffusion Dès le commencement de nos travaux de recherche et en parallèle à nos recherches bibliographiques, nous nous sommes abonnée à des listes de diffusion et à des groupes de discussion autour : des outils de recherche d information, des moteurs de recherche, de l intelligence économique, de la gestion des connaissances, des outils de veille, des outils spécifiques à la documentation, des outils spécifiques aux bibliothèques. Pourquoi une telle démarche? Comme nous l avons vu, l intelligence économique est un processus qui couvre plusieurs champs de façon transversale. Il était donc important pour moi de prendre connaissance d un vocabulaire existant et d en remarquer l évolution. Cela dans le but de repérer les différents concepts propres à cette discipline. Cette façon de procéder permet de repérer les tendances émergentes, les acteurs, les réseaux, les parutions d ouvrages et les conférences ou colloques en rapport avec mes recherches. Après avoir conservé tous les messages des différents groupes de discussion et des listes de diffusion, nous avons focalisé sur ce dernier point : à savoir les colloques autour de l intelligence économique et plus particulièrement de mes recherches. En annexes [A1], se trouve le fruit de l analyse entreprise autour des événements concernant notre sujet de recherche via les événements qui s y 60

63 Partie I - Chapitre 1 L intelligence économique rapportent. Un tableau récapitulatif avec le nom des événements, les dates, lieux, les sites dédiés, les organisateurs et les objectifs rendent compte des types de colloques et des activités de sociétés savantes. Travail préalable Avant de restituer les conclusions du travail de dépouillement, voici le nom des groupes et des listes, ainsi que les thèmes abordés qui ont servi de support de réflexion : Liste de diffusion [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] puis [email protected] intelligenceeconomique@yahoogroupes. fr [email protected] [email protected] [email protected] puis [email protected] [email protected] [email protected] [email protected] puis [email protected] Thèmes L association des professionnels de l information et de la documentation en 1994, a pour objectif de faciliter les échanges d informations, d idées et d expériences. Bibliométrie, scientométrie, infométrie, recherche théorique et appliquée. Cette liste de diffusion permet aux professionnels de la bibliométrie d engager des discussions sur différentes questions, de s informer sur les nouveaux outils, méthodes, traitements des données, essais. Consacrée aux agents intelligents. Imbriqué au site AgentLand.fr, cet espace permet d échanger des solutions pour mieux maîtriser les agents, poser des questions, suggérer des améliorations, donner des avis sur un agent. Cette liste de diffusion regroupe bibliothécaires et documentalistes francophones, et toute personne intéressée par la diffusion électronique de l information documentaire. Ce groupe de discussion est destiné à échanger et à faire évoluer la réflexion sur la gestion de crise. Liste dédiée à la mesure des sciences et techniques Ce groupe a pour objectif de regrouper les nouveaux et anciens étudiants, les professionnels de l intelligence économique, promouvoir notre profession, échanger des offres d emploi et des informations sur l actualité de l intelligence économique au niveau international. Forums et listes de discussion du secteur de l'information-documentation Ce groupe de discussion est consacré à l intelligence économique au sens large, c est à dire la gestion de l information externe : mise en place d un système de veille, outils et méthodes, les aspects de protection de l information, de renseignement, de benchmarking, d influence, de knowledge management. Ce forum dédié à la créativité et à l utilisation des cartes heuristiques, cartes d organisation d idées, topogrammes, arbres à sens, schémas arborescents, cartes mentales et autres «mind maps» Cette liste, consacrée aux moteurs de recherche sur Internet, est un lieu d échanges sur les problématiques, techniques, développements et évaluations/comparaisons des outils de recherche d information sur Internet. Club du Knowledge Management et de l Intelligence Economique. Liste de diffusion de l AFNeT (Association Francophone des utilisateurs du Net de l'ebusiness et de la société en réseau) Prospective sur Internet. De quelle manière Internet peut être un excellent outil pour détecter les nouvelles tendances, constituer un réseau d experts, identifier les réseaux de collaborations. Liste consacrée aux thématiques de veille sur Internet. Historiquement, il s agit de la première mailing-list française sur l intelligence économique et stratégique sur Internet (1998). Créée initialement pour les lecteurs du livre «Intelligence Stratégique sur Internet : comment développer efficacement des activités de veille et de recherche sur les réseaux» (Dunod). Tableau : Listes de diffusion et groupes de discussion étudiés de 2001 à

64 Partie I - Chapitre 1 L intelligence économique A partir du Tableau 1.7-2, il est possible de mettre en perspective les thèmes abordés selon quatre concepts qui sont : les tendances, l information, les outils et la représentation autour de l intelligence économique intelligence économique à forte connotation «gestion des connaissances». Deux verbes d action sous tendent les relations entre concepts et thèmes : collaborer d abord, puis partager. Tendances Collaborer Information Idées Expériences Gestion de crise Nouveaux outils Réseaux d experts Méthodes IE KM Actualité Niveau national, international Protection Traitement des données Cartes heuristiques Cartes d Organisation d idées Outils Partager Représentation Figure : Mise en perspective des thèmes des listes de diffusion et groupes de discussion Pour la réception des messages, nous avons utilisé un logiciel dédié à la gestion de messages : Eudora V.5 à partir duquel nous avons établi un filtre pour chacune des listes de façon à classer le message dès réception dans un dossier. Compte tenu du nombre important d abonnement et de messages reçus, il n est pas possible de tirer parti d un simple survol des messages. Les fonctions de recherche d Eudora 26 ont été privilégiées. Cette étape automatisée permet une diffusion sélective de l information. Toutefois, elle facilite mais n économise pas une longue étape de lecture. 26 Des équations de recherche ont été fixées à partir du mot-clé «colloque» à rechercher dans les dossiers sélectionnés abondance, afnet, agentland Cela permet de ramener uniquement les messages qui comportent des informations autour des événements. Il est possible de raffiner avec d autres mots-clés, puis de présenter les informations par date croissante. 62

65 Partie I - Chapitre 1 L intelligence économique Exploitation des listes de diffusion et groupes de discussion C est par cette phase de lecture qu ont été synthétisées et mises en forme les informations en annexes [A1]. Cela aboutit à un tableau analytique mis en annexes, autour des rubriques suivantes : Evénement, Date, Lieu, Site dédié, Organisateur et Objectifs. Une simple lecture de ce tableau dense en quantité d informations ne permet pas de faire une analyse fine et de mettre l accent sur une évolution des événements. C est pourquoi une seconde lecture dite «intelligente» permet de proposer un second tableau simplifié où sont rajoutées des rubriques pour chaque événement : Thèmes, Secteur, Type d organisateur et Spécialité de l organisateur. Ces nouvelles rubriques constituent des indicateurs et servent de clé de lecture en vue d une fouille de données pour mettre l accent sur des émergences, des évolutions ou encore des tendances. La rubrique «Themes» concernent au principal thème abordé lors de l événement. Le champ «Secteur» identifie le secteur global touché ciblé par l événement. «Organisateur_type» type l organisateur par rapport à sa raison social. Nous avons alors obtenu le tableau ci-dessous fait à partir d Excel. Avant analyse A partir de ce tableau, les fonctionnalités d Excel, hormis les fonctions de calcul, de tri et de représentation graphique, ne nous permettent pas de mettre en valeur des tendances. Evenements Themes Secteur Objectifs Date Organisateur_type Organisateur_specialite journées adest mesure ist information stratégique civilio militaire 2000 militaire stratégie Tableau : Tableau synthétique autour d indicateurs pour l année Evenements Themes Secteur Objectifs Date Organisateur_type Organisateur_specialite VSST veille Ist traitement des données et représentation 2001 université informatiquebibliométrique journées prospective entreprise intelligence stratégique 2001 cabinet privé futur prospective journées outils ie outils pour 2001 université ist-ie outils intelligents management stratégique ISKO exploitation km filtrage de 2001 université information journées futur journées prospective l information gestion ie gestion dans l économie de l immatériel, innovation outils ie prospectives stratégiques 2001 cabinet privé futur 2001 école d ingénieur futur 63

66 Partie I - Chapitre 1 L intelligence économique journées prospective journées prospective journées prospective tendances ie perspectives géopolitiques et géoéconomiques mondiales tendances ie prospective sociodémographique : enjeux tendances ie prospective territoriale et le développement local 2001 cabinet privé futur 2001 institut futur 2001 consultant futur Tableau : Tableau synthétique autour d indicateurs pour l année Evenements Themes Secteur Objectifs Date Organisateur_type Organisateur_specialite journées audit journées prospective journées prospective journées prospective journées prospective journées futur journées prospective projet Entreprise enjeux stratégiques d un dispositif d Intelligence Economique tendances ie prospective sociodémographique : enjeux tendances ie prospective sociodémographique en europe outils ie prospectives stratégiques tendances ie prospective territoriale et le développement local gestion ie gestion dans l économie de l immatériel, innovation tendances ie veille et à la démarche prospective en Europe occidentale : enjeux du futur colloque outils ie cartographie de l information auprès des utilisateurs journées pratiques formations entreprise intelligence économique dans les entreprises de Midi Pyrénées conférence projet ie stratégie-réseau : Comment mobiliser les acteurs 2002 police sécurité 2002 institut futur 2002 institut futur 2002 institut futur 2002 institut futur 2002 institut futur 2002 institut futur 2002 université ist-ie 2002 école d ingénieur ist-ie 2002 université économie Tableau : Tableau synthétique autour d indicateurs pour l année Evenements Themes Secteur Objectifs Date Organisateur_type Organisateur_specialite journées ADBS projet documentation externalisation dans les services de documentation 2003 association documentation Tableau : Tableau synthétique autour d indicateurs pour l année Evenements Themes Secteur Objectifs Date Organisateur_type Organisateur_specialite EGC méthodes Km extraction de 2004 institut information connaissances à partir de données journées veille veille entreprise recherche d information 2004 université informationcommunication 64

67 Partie I - Chapitre 1 L intelligence économique journées linguistiques outilsméthodes km gestion des contenus VSST méthodes km exploitation efficace des grandes masses de documents congré projet entreprise compétitivité et innovation journées exploitation documentation weblogs dans la ADBS publication et diffusion de l information : enjeux 2004 association information-économie 2004 université informatiquebibliométrique 2004 association information 2004 association documentationinformation Tableau : Tableau synthétique autour d indicateurs pour l année Evenements Themes Secteur Objectifs Date Organisateur_type Organisateur_specialite ISKO méthodes Km systèmes 2005 université information d information : orientation utilisateur journées formation ist utilisateurs de 2005 association information ADBS l information EDA exploitation ie entrepôts de 2005 université analyse données et analyse en ligne journées IE franco suisse réseaux entreprise collaborer dans l entreprise et hors de l entreprise 2005 école d ingénieur stratégie-économie rencontres KM et EC réseaux km innovation, compétitivité et connaissances 2005 praticiens stratégie-organisation Tableau : Tableau synthétique autour d indicateurs pour l année Après analyse à l aide du logiciel Cognos Ayant à notre disposition le logiciel Cognos utilisé plutôt pour des analyses financières, nous avons eu l idée de l exploiter pour procéder à une fouille pour faire émerger visuellement des dates clés en rapport avec les événements autour de l intelligence économique et mesurer l apparition de concepts. Cognos : description et prise en main Cognos Série 7 Version 3 est un logiciel qui permet l exploration d une base multidimensionnelle. Cognos regroupe des outils dont Powerplay 27 et Transformer 28. Cognos : installation et prise en main Pour utiliser Cognos pour l application présente, un guide d installation a été réalisé et placé en Annexes [A2]. Il permet d installer et de configurer aisément Cognos pour les besoins de cette analyse. L installation se fait en 11 étapes et la configuration également en 11 étapes. Il suffit de suivre les consignes indiquées avant chaque copie d écran. 27 Powerplay comporte EXPLORER et REPORTER qui permettent la création de rapports et la mise en évidence de résultats pertinents pour l aide à la décision 28 Transformer crée des hypercubes à partir d une base multidimensionnelle 65

68 Partie I - Chapitre 1 L intelligence économique Les tableaux à réalisés à l aide d Excel sont importés dans une table Access. Nous utilisons le logiciel Transformer qui permet de créer un modèle où apparaissent les sources de données, les mesures, les cubes ainsi que la grille des dimensions selon le schéma ci-dessous : Figure : Utilisation de Transformer A partir du menu Diagramme, il est possible d afficher le diagramme. Nous avions choisi des grilles de dimension autour de «Secteur», «Date» et «Organisateur_type». La figure cidessous affiche le diagramme par secteur qui fait apparaître les relations avec «Themes», «Organisateur_specialite», «Evenements» et «Objectifs» : Figure : Diagramme des catégories obtenu à partir de Transformer 66

69 Partie I - Chapitre 1 L intelligence économique La Figure gagne en lisibilité par rapport aux Tableaux à A partir du menu Outils de Transformer, on lance le logiciel PowerPlay qui permet l analyse multidimensionnelle. Figure : Rapport obtenu à partir du logiciel PowerPlay La puissance de PowerPlay permet de varier les niveaux d analyse. La Figure fait apparaître clairement que le secteur «ie» pour Intelligence Economique est le secteur le plus ciblé des événements en On peut encore améliorer la représentation des données à l aide d un cube graphique selon le graphique ci-dessous : Graphique : Hypercube autour des secteurs L hypercube fait apparaître des émergences et soulignent le fait que l «ie» commence à être représentée plus exactement en D une façon très simple, on modifie les vues par 67

70 Partie I - Chapitre 1 L intelligence économique exemple autour des types d organisateurs. On s aperçoit ainsi que les universités, au cours des années, représentent régulièrement le nombre le plus important d organisateur. Le secteur de la documentation est largement concerné depuis L Intelligence Economique par l analyse de bases bibliographiques Pour compléter, l état de l art autour de l intelligence économique nous avons procédé à une recherche bibliographique exhaustive. Pour cela nous avons utilisé les bases de données accessibles aux services communs de documentation de l Université Henri Poincaré, de l Université Nancy 2 et à la bibliothèque du LORIA. Ces bases de données sont aisément accessibles pour tout membre de ces universités, via le consortium Couperin 29 et après avoir correctement configuré le proxy 30 du navigateur. Les bases de données interrogées sont : Current contents, Inspec, Eric, Pascal et Francis. Avant d expliciter le processus de recherche, le paragraphe ci-après propose un descriptif des bases de données. Descriptif des bases de données : sources de l étude bibliographique Current Contents : bases de sommaires produites par l ISI (Institute for Scientific Information, USA). Elles couvrent les 50 dernières semaines et la mise à jour est hebdomadaire. Current Contents regroupent 7 séries : Agriculture, biology and environmental sciences (990 titres en agriculture, sciences de la vie et environnement) Social and behavioral sciences (1 580 titres en sciences sociales et comportementales) Clinical medicine (1 000 titres en médecine clinique) Engineering, computing and technology (1 030 titres en sciences de l ingénieur) Life sciences (1 400 titres en sciences biologiques et en recherche médicale) Physical, chemical and earth sciences (940 titres en physique, chimie et sc. de la terre) Arts and humanities (1 110 titres en sciences humaines) INSPEC : INSPEC Science & Technology de l Institute of Electrical Engineers (IEE) est la première base de données mondiale dans le domaine de la physique, de l électronique et du génie électrique, de l informatique, de l informatique industrielle et des technologies de l information. INSPEC est une base de données bibliographique contenant des références Configuration du proxy : 68

71 Partie I - Chapitre 1 L intelligence économique avec résumés signalant la littérature mondiale en physique, électronique, génie électrique et informatique. Les documents signalés sont principalement des articles de revues et des communications de congrès, mais les 6,2 millions de notices de la base de données recensent également un nombre important d ouvrages, de rapports techniques et de thèses. Parmi les documents cités dans INSPEC, on retrouve titres de revues et plus de actes de congrès, ouvrages et rapports. ERIC : La base ERIC (Educational Resources Information Center) est publiée par le ministère de l Education américain. Elle correspond à deux journaux publiés : Resources in education, RIE et Current Index to Journals in Education, CIJE. Elle donne accès à quelques documents et plus de articles par an. Elle contient les références de conférences, publications officielles, thèses, travaux universitaires, depuis 1966 à aujourd hui avec mise à jour mensuelle. PASCAL : base de données bibliographiques multidisciplinaire et multilingue produite par l INIST 31 (Institut national de l Information Scientifique et Technique) du CNRS. Elle dépouille 4500 titres de périodiques et des monographies (rapports, congrès, thèses, livres). Elle contient 12 millions de notices depuis 1973 et couvre l essentiel de la littérature mondiale en sciences, technologie et médecine. La mise à jour est mensuelle. FRANCIS : base de données bibliographiques multidisciplinaire et multilingue produite par l INIST (Institut national de l information scientifique et technique - CNRS). Elle contient 2 millions de références depuis 1972 et couvre l essentiel de la littérature mondiale en sciences sociales et sciences humaines. La mise à jour est trimestrielle. Pour procéder à l interrogation de ces bases de données, il est possible d utiliser deux modes d accès différents. Avant tout, il faut préciser que ces bases de données sont accessibles également par l intermédiaire du consortium Couperin pour tout membre de l Université Henri Poincaré, de l Université Nancy 2 et du LORIA. Les deux modes d accès sont : 1. Via le web Pour l accès, via le web, il suffit de configurer le navigateur avec un proxy. Dans ce cas l utilisateur final est amené à exporter les notices, puis les réimporter dans un logiciel bibliographique. 31 INIST : Institut national de l'information Scientifique et Technique 69

72 2. Via un logiciel bibliographique Partie I - Chapitre 1 L intelligence économique Nous avons préféré cette deuxième solution qui consiste à utiliser un logiciel bibliographique. Nous avons choisi EndNote V.8 32 qui permet de se connecter directement aux bases de données, après avoir correctement configuré un fichier de connexion. Cette procédure permet de rapatrier directement dans la base de données EndNote les notices bibliographiques et économise deux étapes lorsque l on procède via le web à savoir : exportation, puis réimportation avec maîtrise d utilisation de filtres adéquats. Analyse bibliométrique : exploitation des données Pour ce travail d analyse ou de bibliométrie, nous avons procédé en deux étapes. La première étape consiste à analyser de façon très large et très exhaustive les bases de données autour de 39 mots-clés définis en corrélation avec mon sujet de recherche. Les mots-clés français sont traduits en anglais. Plusieurs questions tournent autour des mêmes mots-clés en modifiant l accentuation ou l écriture en attaché, avec trait d union ou blanc pour certains mots composés. EndNote permet de construire plusieurs bases de données. Ce tableau d aide à l organisation de l interrogation des bases de données, marque d une croix les bases de données qui donnent des réponses autour du mot recherché et totalise le nombre de références bibliographiques trouvées pour chacune d elle : Mots-clés Current Inspec Eric Pascal Francis Contents Datawarehouse X X X X X data warehouse X X X X X Datamart X X X X X data mart X X X X X entrepôt données X X X X X entrepot donnees X X X X X bases métiers X X X X X bases metiers X X X X X OLAP X X X X X analyse multidimensionnelle X X X X X analyze multidimensional X X X X X intelligence économique X X X X X intelligence economique X X X X X economic intelligence X X X X X système information X X X X X systeme information X X X X X systeme information strategique X X X X X système information stratégique X X X X X strategic information system X X X X X système information décisionnel X X X X

73 Partie I - Chapitre 1 L intelligence économique systeme information decisionnel X X X X X decisional information system X X X X X Métas données X X X X X Metadonnees X X X X X meta data X X X X X Metadata X X X X X méta données X X X X X meta donnees X X X X X Référentiel X Referentiel cube analyse X X cube analyze X X urbanisation System information X X meta-model X X Metamodel X X metamodel Data warehouse X X metadata reference frame X X utilisateur final X X end-user X X Notices trouvées par base Tableau : Récupération de notices bibliographiques pour le mois de janvier 2005 Ces notices bibliographiques constituent pour nous, une base conséquente, dans laquelle nous pouvons procéder à des analyses ciblées. Pour clore cette première partie sur l état de l art autour de l intelligence économique, nous avons donc utilisé cette base source pour les publications autour de l intelligence économique. Nous avons pu faire émerger 255 titres de publications dans des revues, des thèses et des colloques, pour la période de 1993 à 2004 autour de l intelligence économique. Voici à quoi ressemble la table des données : Figure : Sélection de notices autour de l intelligence économique dans EndNote 71

74 Partie I - Chapitre 1 L intelligence économique Par cette analyse, nous cherchions simplement à mettre en relation deux données, c est-à-dire le nombre de publication par rapport aux dates. Deux dates importantes émergent, la première en 1996 avec une ascension dès 1995, la seconde en Ces dates font suite à la parution du rapport Martre et à une effervescence autour de l Intelligence Economique dans la littérature qui aboutit au rapport de Bernard Carayon. Martre Effervescence IE puis Rapport Carayon Graphique : Dates «phare» de l intelligence économique entre 1993 et 2004 A partir des 255 notices bibliographiques sont extraites uniquement les notices provenant d articles de revues. Cela aboutit à 104 références. Dès 1993, 5 revues de documentation consacrent des articles à l Intelligence Economique. L année suivante les revues en documentation enrichissent leur contenu par les secteurs de l information et des connaissances. A partir de 1995, on remarque une mutation du concept «documentation» et «information» vers le concept «technologie de l information». Titre Nbre Date Secteur Technologies internationales Strasbourg Information Technologie IDT Information, documentation, transfert des connaissances Information Documentation Connaissances Archimag Vincennes Documentation Documentaliste Documentation Online Weston CT Documentation Bases Documentation Humanisme et entreprise Paris Economie politique Database Weston Documentation Online Weston Documentation Analusis Chimie Argus Montreal Documentation Ciencia da informacao Information Documentacion de las ciencias de la Documentation informacion EContent Wilton Conn Documentation FID review Documentation Fonderie fondeur d aujourd hui Entreprise 72

75 International journal of information sciences for decision making International journal of information management Partie I - Chapitre 1 L intelligence économique Information Gestion Information Gestion L Informatique documentaire Informatique Documentation Le Progrès technique Ingénierie Les Cahiers de la fonction publique et de l administration Administration Micro bulletin Information Pour Connaissances RBM Revue européenne de biotechnologie médicale Techniques de l ingénieur L Entreprise industrielle Biotechnologie Entreprise Un point sur Agronomie Tableau : Intérêt des revues de documentation à l intelligence économique Cette étude met en relief le passage de l information à la connaissance dans le cadre du processus d Intelligence Economique. Nous constatons que les technologies et les organisations sont de plus en plus fortement imbriquées et interactives. A l heure actuelle nous ne pouvons plus parler de technologies sans aborder des problèmes d Organisation donc de communication et d information. Explicitons nos propos par un exemple : si nous nous plaçons dans le domaine des bibliothèques, une nouvelle technologie est apparue pour résoudre automatiquement la mise à jour les liens des revues électroniques. Cette technologie aboutit à la notion d «Electronic Ressources Management». De ce fait nous assistons à l emploi d un nouveau vocable qui au terme de «bases de données» préfère le terme de «bases de connaissances». Pour conclure sur le chapitre 1 de la première partie nous avons montré qu il est impossible de définir l intelligence économique par la définition de chacun des deux termes qui composent l expression «intelligence économique». Nous avons démontré que l expression constitue un concept englobant une suite de processus dont le but n est pas d accumuler des archives mais de trouver des informations pertinentes, de créer de la connaissance permettant de guider le processus décisionnel. Nous remarquons dans la littérature que le concept est très lié au monde de l entreprise. Pourtant, le concept n est pas le «monopole» des institutions privées, c est pourquoi au terme «entreprise», il est préférable d utiliser le mot «organisation» ou «institution». Cela permet de comprendre que l intelligence économique concerne également les organisations ou institutions publiques. Au terme «clients» nous préférons «utilisateurs». Nous constatons également que l intelligence économique est absente en tant 73

76 Partie I - Chapitre 1 L intelligence économique que concept au niveau des gouvernances de l Université, mais qu il fait l œuvre de formation voire de plan de formation au sein des universités. Dans le chapitre 2 nous allons aborder les systèmes d information, les systèmes d information stratégiques et les systèmes d information documentaires pour comprendre comment ces derniers peuvent participer au passage d un système d information à un système d information stratégique dans un contexte universitaire. 74

77 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information 75

78 76

79 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information La notion de concurrence, elle ne s exprime pas forcément qu en données financières, mais également en termes de conséquences si les attentes des utilisateurs ne sont pas satisfaites. Pour une institution publique, il en va de même que pour une institution privée au niveau de l anticipation des besoins des utilisateurs pour éviter les risques à prendre les mauvaises décisions ou à ne pas prendre de décision. Un des points centraux de l organisation est son système d information. En effet informatisé ou non il est devenu le support de toute circulation d information et de toute décision. Les paragraphes suivants, consacrés aux principes de gestion par les systèmes d information, permettent d aborder les systèmes d information et les systèmes d information décisionnels via la business intelligence. La business intelligence faisant office de trait d union entre l intelligence économique et le système d information décisionnelle dans notre étude Intelligence économique, business intelligence et information décisionnelle La Business Intelligence est l équivalent anglais du terme Veille Economique. L intelligence économique, comme nous l avons fait remarquer, est une notion plus vaste qui couvre l ensemble des activités de collecte d informations sur l environnement économique : concurrence et marchés, technologie, politique, société. La business intelligence [GOUARNE, 1998] est devenue un quasi-synonyme de l information décisionnelle. La business intelligence, dans notre conception des systèmes d information traite des flux d information provenant essentiellement de quatre sources : Le système d information interne de l organisation, Les partenaires : institutions privées ou publiques, Des fournisseurs de données institutionnels : organisations professionnelles, instituts de sondage, producteurs de bases de données, Les supports d information publics : la presse. Dans le monde des entreprises grandes ou petites dont l infrastructure repose en grande partie sur des moyens informatiques, la mise en oeuvre de la business intelligence est explicite et passe de plus en plus par un Système d Information Décisionnel (SID). Un Système d information décisionnel, bien entendu, n est pas un système qui prend les décisions. En 77

80 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Anglais, on dit Decision Support System (DSS 33 ), il s agit d un système de «soutien» à la décision. La décision elle-même est humaine ; la vocation du système d information décisionnel n est pas d automatiser la décision, elle est d automatiser le processus de recherche d information et la mise en forme des données nécessaires à la prise de décision. La décision elle-même est un processus socio-technique, dans lequel les acteurs humains sont en inter-action de plus en plus étroite avec des systèmes automatisés. La notion de système d information décisionnel s est développée dans la dernière décennie du 20 ème siècle, alors que celle de Système d Information (SI) existait déjà. Pourquoi, alors ayant déjà «inventé» le système d information, il a fallu en inventer un autre, qualifié de décisionnel? Que demander de plus que des «informations» pour pouvoir décider? La réponse est à la fois simple et embarrassante : le système d information «classique» est un système... qui n informe pas. Lorsque le concept de système d information s est imposé, les «Directeurs Informatiques» (DI) ont été requalifiés de «Directeurs des Systèmes d Information» (DSI). La conception des systèmes d information a permis de remettre la technique à sa place au service du contenu informationnel. Ceci a favorisé une vision systémique cohérente de l ensemble des applications informatiques, qu on ne voulait plus voir comme une collection de systèmes isolés. Ce volontarisme, de toute évidence, n a pas suffi, car aujourd hui encore, dans les directions des systèmes d information, s il est vrai qu on s occupe de plus en plus du système d information, on est bien obligé de faire surtout de l informatique. Les systèmes d information reflètent un cloisonnement par métiers et illustrent que les organisations sont rarement pensées comme un «système». Un courant réformateur, le Business Process Reengineering 34 (BPR), tend à réorganiser l entreprise par processus, donc à diluer les cloisonnements organiques traditionnels et à imposer une meilleure intégration du système d information. Le système d information est encore, dans une large mesure, une vision d état-major. Dans une grande organisation, les applications sont aujourd hui largement interconnectées, voire techniquement intégrées dans les cas favorables, mais elles ne forment pas un ensemble 33 DSS : Decision Support System 34 BPR : Business Process Reengineering 78

81 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information informationnel homogène. Si elles constituaient un tout sémantiquement cohérent, les problématiques de gouvernance et d urbanisme des systèmes d information, si en vogue de nos jours, n auraient pas de raison d être Système d information système d information décisionnel Système d information Ce que nous appelons aujourd hui système d information [FOUCAUT et THIERY, 1996a] et [ROCHFELD et MOREJON, 1989] est un ensemble organisé mais hétérogène de composants automatiques et/ou semi-automatiques de traitement de données dont chacun est prioritairement destiné à soutenir une activité opérationnelle particulière. Incidemment, chacun de ces composants peut produire des informations de contrôle très détaillées sur l activité à laquelle il est lié. Mais ces informations ne sont pas directement exploitables à des fins d analyse et de prévision. De ces limites est venue l idée d un autre système d information, spécialement et exclusivement conçu pour l aide à la décision, et découplé des opérations. Dans les années 1970, naît le fondement théorique de la notion de système d information qui correspond au courant de pensée systémique. La structuration systémique d une organisation est vue comme un système composé de trois sous-systèmes, à savoir : Le Système Opérant : Le système opérant est l appareil de production, qui importe, transporte, transforme et exporte des flux matériels, énergétiques et financiers. Le Système d Information : Le système d information constitue à la fois le reflet et le support informationnel du Système Opérant. Il capte des données dans le Système Opérant (flèche jaune) auquel il renvoie des commandes. Le Système de Pilotage : Le système de pilotage détermine le comportement de l organisation en utilisant le Système d Information comme une interface à double sens, pour être informé sur le Système Opérant et agir sur ce dernier. 79

82 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Système de pilotage Système d information Système opérant Figure : Structuration systémique d une organisation Ce schéma ne prévoit pas de place pour le système d information décisionnel. Pour essayer de préciser le rôle du système d information décisionnel dans une organisation, on pourrait compléter le schéma précédent en situant le système d information décisionnel entre le système d information et le système de pilotage, pour illustrer la remontée des informations, mais aussi dans l autre sens pour montrer l impact des décisions sur le système d information. Système de pilotage Système d information Système opérant Figure : Situation du système d information décisionnel au sein de la structuration systémique de l organisation Le Système d Information possède toutes les données du problème décisionnel, mais pas sous la forme homogène, cohérente, simplifiée qui convient. Un gros travail de transformation et de mise à disposition est à fournir. Le rôle du système d information décisionnel est d automatiser les traitements correspondants, dans des espaces de travail séparés du reste du système d information afin d éviter toute perturbation mutuelle Système d information décisionnel Un système d information décisionnel est un système informatique intégré, conçu spécialement pour la prise de décision, et qui est destiné plus particulièrement aux dirigeants d entreprise ou d institution. La DSS fait appel à plusieurs processus qui aboutissent à différents types de décisions. 80

83 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Le schéma ci-dessous permet de montrer que dans un système d information, on se place à la fois dans l opérationnel et dans le décisionnel. La décision et l action sont complètement imbriquées. Il existe une boucle de rétroaction permanente entre opérations, informations et décisions. Secteur d aide à la prise de décision Décision stratégique Processus d innovation Décision tactique Processus d amélioration Décision opérationnelle Contrôle de processus Information Données Processus Figure : Système d information décisionnel et processus Le processus opérationnel produit des données. Certaines de ces données peuvent être exploitées par des systèmes automatisés ; elles provoquent des rétroactions non décisionnelles sur le processus. D autres sont converties en informations qui sortent du système d information «opérationnel» pour entrer dans le système d information décisionnel. Le système d information décisionnel, combiné avec le décideur humain, constitue un dispositif qui, de manière immédiate ou différée, est destiné à rétroagir lui aussi sur les processus : c est-à-dire sur le système opérant. La figure montre le cycle de rétroaction entre processus, données, information, prise de décision et impact sur les processus. Les systèmes d information décisionnel conçus jusqu à présent tiennent compte très imparfaitement de cette intégration cyclique entre décision et action. Cette limitation tient en partie à des facteurs techniques par conception. Les logiciels agissent au niveau des différents processus et sont donc mal intégrés entre eux au sein du système d information. Cette limitation provient aussi de facteurs sociaux et organisationnels, notamment de la difficulté à modéliser l activité décisionnelle et à la décrire en spécifications informatiques. Les démarches d urbanisation des systèmes d information s effectuent avec le projet de résorber les carences des systèmes d information en place. Cela se concrétise par des 81

84 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information projets d EAI 35 (Enterprise Application Integration) et également du développement des «portails» qui sont des socles techniques d intégration. Par ailleurs, la plupart des systèmes d information décisionnels des grandes organisations, sont conçus à partir de données exclusivement internes. La portée stratégique de tels systèmes reste donc limitée. Il est nécessaire d avoir une vue interne et externe à l organisation de façon à présenter au décideur, à tout instant, une vision combinée en temps réel du terrain, de ses moyens d actions par rapport à son environnement. La conception des systèmes d information décisionnels est complexifiée par la prise en compte des données non structurées. Cette difficulté découle d un problème de format de données. Les données sont considérées comme structurées si on peut les représenter sous forme de fiches ou de tableaux dont la structure est prédéfinie et régulière. Par exemple, un catalogue de produits indique pour chaque article, un nom, un code, un prix, une quantité en stock. Dans un ensemble de données structurées, chaque donnée élémentaire possède un «type» prédéfini. Le type étant une notion mi-technique, mi-sémantique : il peut s agir d une date, d un montant, d un nombre entier ou d un texte. À l opposé, une donnée est dite «non structurée» s il n est pas possible de prédéfinir sa structure et de la ranger dans une table. Une telle donnée peut être, par exemple, un article de presse, une animation graphique, une séquence musicale, une page. Ces données non structurées sont parfois appelées documents ou documents électroniques. En réalité, les données dites non structurées sont tout simplement des données dont la structure est plus complexe. Les difficultés viennent de l inaptitude des systèmes de gestion de bases de données classiques à gérer les structures complexes. On remarque aussi que les dispositifs dédiés à la bureautique, à la gestion documentaire et au travail collaboratif ont toujours été gérés en marge du système d information. Cette marginalisation peut être rectifiée par le recours au format XML qui permet de structurer des données complexes. 35 EAI : Enterprise Application Integration 82

85 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Une fonction importante d un système d information décisionnel est de pouvoir prendre en compte des données historisées. Le contenu informationnel des systèmes d information décisionnel comporte deux composantes : 1) Les données statiques ou référentielles, qui décrivent les éléments du système opérant. Elles concernent la structure de l organisation. 2) Les données dynamiques ou événementielles, qui reflètent l activité. Elles concernent les transactions. Un système d information décisionnel permet de combiner l historique avec des données en temps réel, ce qui favorise l anticipation et la projection de scénarios Fonctions et architecture d un système d information décisionnel Le système d information décisionnel met en oeuvre cinq fonctions fondamentales [FRANCO, 1997b] autour de la collecte des données, l intégration des données, la diffusion des données information, la présentation des données et l administration des données : 1) La collecte des données brutes dans leurs environnements d origine, ce qui implique des activités plus ou moins élaborées de détection et de filtrage, car un excédent de données, un défaut de fiabilité ou un trop mauvais rapport signal/bruit sont pires que l absence de données, 2) L intégration des données, c est-à-dire leur regroupement en un ensemble technique, logique et sémantique homogène approprié aux besoins de l organisation, Les fonctions de collecte et d intégration sont étroitement liées entre elles, et sont généralement associées à un composant informatique central appelé entrepôt de données (data warehouse). Le Système de Collecte et d Intégration (SCI) capte les données primaires pour les intégrer dans un entrepôt de données. Cette fonction s effectue à l aide des outils et des techniques d extraction de données : ETL (Extract, Transform & Load). 3) La diffusion ou la distribution d informations élaborées à partir des données dans des contextes appropriés aux besoins des individus ou des groupes de travail utilisateurs, 4) La présentation, c est-à-dire les conditions de mise à disposition de l information : contrôle d accès, personnalisation, ergonomie, La diffusion et la présentation sont des fonctions fortement orientées sujet, tournées vers l utilisateur et son métier, manipulant des contenus à forte valeur ajoutée informationnelle et non des données brutes ; elles sont donc fortement imbriquées logiquement et techniquement. Le Système de Diffusion et de Présentation (SDP) présente à l utilisateur les informations dans des formats et des conditions appropriées à la démarche décisionnelle. C est à ce stade que sont mis à la 83

86 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information disposition des décideurs des outils d analyse multidimensionnelle : OLAP (On Line Analytical Processing). L analyse multidimensionnelle repose sur des bases de données dérivées de l entrepôt de données orientées par type d utilisateurs appelées magasins de données ou bases métiers (data marts). 5) L administration, qui gère le dictionnaire de données et le processus d alimentation de bout en bout, car le système d information décisionnel, outil de pilotage, doit luimême être piloté. Le Système d Administration contrôle le bon fonctionnement de l ensemble, garantit la traçabilité des données et permet de déterminer le degré d actualité de chaque information. Il ressort clairement de ces cinq points que le processus de transformation des données en information pertinente s opère par la prise en compte des besoins de l organisation et la prise en compte des besoins des utilisateurs finals, dans un contexte défini. Reprenons ces cinq fonctions fondamentales propres au système d information décisionnel : Source de données Source de données Source de données D O N N E E S Extraction, intégration des données filtre Entrepôt de données O L A P Bases métiers Bases métiers Bases métiers Utilisateur final Figure : Fonctions et architecture d un système d information décisionnel Si nous analysons la Figure 2.2-4, nous constatons qu une des premières difficultés provient des sources de données. Ces sources de données sont hétérogènes et reposent sur des architectures qui diffèrent sur le plan de leur modèle. On peut être face à des bases de 84

87 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information données 36 reposant sur différents modèles comme par exemple : le modèle hiérarchique 37, le modèle réseau 38, le modèle relationnel 39, le modèle déductif 40, le modèle objet 41. La Figure illustre les fonctions et l architecture d un système d information décisionnel, nous pouvons déjà préciser un certain nombre de verrous en rapport avec notre recherche. Nous nous plaçons au niveau de la représentation de l utilisateur final. Pour être amené à représenter l utilisateur final, nous avons également besoin de pouvoir représenter le système d information décisionnel dans son ensemble. Nous pouvons déjà dire que la mise en perspective de l utilisateur final et du système d information décisionnel passera par différents niveaux ; ces niveaux pouvant être de l ordre du fonctionnel, de l applicatif ou encore de l organisationnel. Il s agit de pouvoir rendre exploitables des bases de données reposant sur des modèles variés. Un verrou important apparaît en Figure 2.2-4, il se situe au niveau de la notion d intégration. Nous retrouvons cette fonction d intégration dans un réservoir à partir de bases hétérogènes dans l entrepôt de données. Afin de ne pas confondre structure et outil, l architecture d un système d information décisionnel repose toujours sur un modèle. C est le modèle qui est à l origine des choses. Repartons du modèle ANSI/SPARC pour caractériser un système de gestion de bases de données. 36 Bases de données : Système d Organisation de l'information, conçu pour une localisation et une mise à jour rapide et facile des données. 37 Modèle hiérarchique : Les données sont classées hiérarchiquement, selon une arborescence descendante. Ce modèle utilise des pointeurs entre les différents enregistrements. Il s'agit du premier modèle de SGBD dès le début des années Modèle réseau : Ce modèle utilise des pointeurs vers des enregistrements. Toutefois la structure n'est plus forcément arborescente dans le sens descendant. Ce type de modèle a vu le jour au milieu des années Modèle relationnel : SGBDR, Système de gestion de bases de données relationnelles, en anglais : Relational data model apparu en Base construite sur le modèle relationnel qui permet de structurer les données en un ensemble de tables ou tableaux, appelés relations. Les données sont enregistrées dans des tableaux à deux dimensions : lignes et colonnes. La manipulation de ces données se fait selon la théorie mathématique des relations. A la fin des années 90 les bases relationnelles sont les bases de données les plus répandues : environ trois quarts des bases de données. 40 Modèle déductif : Les données sont représentées sous forme de table, mais leur manipulation se fait par calcul de prédicats. 41 Modèle objet : SGBDO, Système de gestion de bases de données objet. Organisation cohérente d'objets persistants et partagés par des utilisateurs concurrents modélisant une application. Les données sont stockées sous forme d'objets, c'est-à-dire de structures appelées classes présentant des données membres. Les champs sont des instances de ces classes. Les modèles objets ont vingt ans mais peu de SGBDO sont opérants actuellement. 85

88 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information L architecture ANSI/SPARC L architecture ANSI/SPARC, datant de 1975, définit des niveaux d abstraction pour un système de gestion de bases de données. Elle est définie sur trois niveaux : Niveau externe : Il définit les vues des utilisateurs. Chaque schéma externe donne une vue sur le schéma conceptuel à une classe d utilisateurs. Niveau conceptuel : Il définit l arrangement des informations au sein de la base de données. Le schéma conceptuel est produit par une analyse de l application à modéliser et par intégration des différentes vues utilisateurs. Ce schéma décrit la structure de la base indépendamment de son implantation. Il est obtenu par intégration des vues externes. Niveau interne ou physique : Il définit la façon selon laquelle sont stockées les données et les méthodes pour y accéder. Figure : Système de gestion de bases de données, l architecture ANSI/SPARC Les caractéristiques d un système de gestion de bases de données L architecture à trois niveaux, définie par le standard ANSI/SPARC, permet d avoir une indépendance entre les données et les traitements. Il offre la capacité de modifier le schéma de la base de données à un niveau donné, sans remettre en cause le schéma aux niveaux supérieurs. D une manière générale un SGBD 42 doit avoir les caractéristiques suivantes : Indépendance physique : Le niveau physique peut être modifié indépendamment du niveau conceptuel. Cela signifie que tous les aspects matériels de la base de données n apparaissent pas pour l utilisateur, il s agit simplement d une structure transparente de représentation des 42 SGBD : système de gestion de bases de données. 86

89 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information informations. On peut modifier l organisation physique des fichiers, rajouter ou supprimer des méthodes d accès. Indépendance logique : le niveau conceptuel doit pouvoir être modifié sans remettre en cause le niveau physique, c est-à-dire que l administrateur de la base doit pouvoir la faire évoluer sans que cela gêne les utilisateurs. L ajout ou le retrait de nouveaux concepts ne doit pas modifier des éléments qui n y font pas explicitement référence. Manipulabilité : des personnes ne connaissant pas la base de données doivent être capables de décrire leurs requêtes sans faire référence à des éléments techniques de la base de données. Rapidité des accès : le système doit pouvoir fournir les réponses aux requêtes, le plus rapidement possible, cela implique des algorithmes de recherche rapides. Administration centralisée : le SGBD doit permettre à l administrateur de pouvoir manipuler les données, insérer des éléments, vérifier son intégrité de façon centralisée. Limitation de la redondance : le SGBD doit pouvoir éviter dans la mesure du possible des informations redondantes, afin d éviter d une part un gaspillage d espace mémoire mais aussi des erreurs. Vérification de l intégrité : les données doivent être cohérentes entre elles, de plus lorsque des éléments font référence à d autres, ces derniers doivent être présents. Partageabilité des données : le SGBD doit permettre l accès simultané à la base de données par plusieurs utilisateurs. Sécurité des données : Le SGBD doit présenter des mécanismes permettant de gérer les droits d accès aux données selon les utilisateurs. L architecture des systèmes gestion de bases de données par niveau, constitue des étapes à prendre en compte lors de la conception de l entrepôt de données qui participe de l urbanisation d un système d information. Développement des bases de données à finalité opérationnelle De nombreuses structures, lors de l éclosion de l informatique individuelle, ont développé des bases de données à finalité opérationnelle ou fonctionnelle, parfois appelées bases «métier». Ces bases servaient en général à un groupe précis, pour les aider à augmenter leur efficacité 87

90 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information dans un domaine bien particulier. Du fait de ces spécificités, chaque base était souvent conçue indépendamment des autres : il en a résulté des systèmes d information parcellisés, balkanisés, sans cohérence. Pour pouvoir être intégrées à un entrepôt de données, les bases métiers doivent passer par une étape de conception avant d être fusionnées. 43 Certains éditeurs de logiciels ont compris l intérêt qu ils pouvaient tirer d une unification de ces bases de données. Ainsi il est possible de croiser des données incohérentes pour trouver des corrélations intéressantes. Des créations d Infocentres ont vu le jour pour offrir une vision centralisée de toutes les données de l entreprise. Ce travail de réunification de systèmes de gestion des données reste faible dans le secteur public. On s aperçoit que certaines bases du personnel peuvent servir à créer des «qui fait quoi», que des bases géographiques peuvent permettre de diffuser à chaque service délocalisé les données de sa région. Dans un autre registre des bases d erreurs peuvent permettre à un éditeur de logiciels de valoriser sa politique d amélioration de ses produits. Dans un domaine spécifique comme celui de la documentation une politique d acquisition dans un institut documentaire devient plus performante en mettant en relation des données «lecteurs», des données «emprunt», des données «fréquentation», des données «consultation» et des données «inscription» ; ces données appartenant à des services différents. Même des bases de données a priori très pointues et hermétiques peuvent donner lieu à la création de services d information à valeur ajoutée pour des publics plus ou moins généralistes. Aussi de plus en plus, les données de l institution ou de l administration deviennent diffusables et valorisables Difficultés rencontrées lors de la mise en œuvre du processus d évolution La plupart des bases de données métier ont été conçues par des spécialistes pour des spécialistes d un sujet donné. En devenant des instruments de communication à destination du public, elles doivent subir des adaptations. Par exemple, un simple catalogue de bibliothèque doit être adaptable dans sa conception pour s intégrer au système d information globale de l université. 43 Infocentre : Concept inventé par IBM, ancêtre de l'executive Information System (EIS) dans les années

91 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information De plus, l entretien de ces bases dans le temps n a pas toujours été parfaitement suivi. Ces bases peuvent avoir également subi des développements spécifiques pour satisfaire des spécificités de fonctionnement d une organisation. Citons quelques difficultés pour en faire des bases publiables : Des bases malpropres. Cela implique, avant publication, une remise à niveau de la base parfois très coûteuse : coût de détermination, d acquisition et de saisie des données manquantes. Des bases avec des champs manquants. Par exemple, mention de la commune sans mention de la région. Cela oblige à programmer des croisements avec des tables de correspondance. Une indexation des enregistrements de la base ne correspondant pas aux besoins des utilisateurs pour parvenir à l information. Une indexation des informations trop détaillée, à partir de thésaurus dont une partie des termes sont incompréhensibles aux utilisateurs. La désignation de certains champs par des codes connus de l organisation mais indéchiffrables par des tiers. La gestion des bases par des services différents. Le champ commun qui permettrait de croiser des données de différentes bases n est pas codé de la même façon d une base à l autre. Les standards techniques diffèrent d une base à l autre. Ces standards techniques particuliers ne sont pas toujours interopérables. Les référentiels varient d un corpus de données à l autre. Ces différents points témoignent des difficultés à surmonter pour rendre diffusable une base de données métier. Les coûts de remise à niveau peuvent être importants. Il convient, lors de la création d une nouvelle base, de prendre des précautions pour que ce soit possible d extraire des données pour les intégrer dans un entrepôt de données. Le recul que l on a sur l existant autour des bases de données implique la mise en place d une fonction Administration Des Données. Cette fonction est indispensable pour la création et le 89

92 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information suivi d un système d information. L entité ADD 44 aura une vision globale des données disponibles dans l organisation, des incohérences à réviser. L ADD pourra, en coopération avec les administrateurs des différentes bases métiers, définir les axes d indexation communs des enregistrements facilitant leur publication ultérieure et le développement des interfaces de consultation adaptées au grand public. Le recours à l entrepôt de données permet de proposer des solutions pour faire évoluer un Système d Information en un Système d Information Stratégique voire en un Système d Information Décisionnel. Le transfert d un Système d Information en Système d Information Décisionnel repose sur les bases métiers orientées vers les acteurs De la conception des systèmes d information à la conception des systèmes d informations stratégiques L évolution actuelle des systèmes d Information dans les entreprises vers des architectures client-serveur nécessite d adapter les méthodes classiques de conception de système d information. En effet, dans ces nouvelles architectures, les applications client-serveur se présentent sous la forme de composants de différents types : composants de stockage, composants de traitement, et composants dynamiques d exécution. Actuellement le standard en informatique d organisation reste la méthode Merise ou ses dérivées [ROCHFELD et MOREJON, 1989] et [FOUCAUT et THIERY et SMAILI, 1996b]. Merise est une méthode de conception de système d information. Elle est une méthode de conception, de développement et de réalisation de projets informatiques. Elle a été dérivée en Merise 2 [PANET et LETOUCHE, 1994] où le lien les données et les traitements est enfin effectif et réel Processus de modélisation La modélisation sert à se représenter une construction à partir de représentations intelligibles artificielles, symboliques de situations d après les recherches en conception des systèmes d information de [FOUCAUT et THIERY, 1996a] et [FOUCAUT et THIERY, 1998]. Le propos de l équipe SITE, sur l idée de base de leurs propositions, est qu il est possible d utiliser le même modèle tout au long des étapes de cette conception qui aboutit, en final, à l ensemble de composants logiciels constituant le système d information automatisé. 44 ADD : Administration Des Données. 90

93 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information La tendance actuelle est aux méthodes de conception orientées objet telles que OMT 45 [RUMBAUGH, 1995] ou UML 46 [FOWLER et SCOTT, 1997] ou tout au moins reposant sur des modèles plus évolués tel que celui de Merise/2 [PANET et LETOUCHE, 1994]. Sans occulter les mérites et avancées que Merise a permis en informatique d entreprise, il faut reconnaître que la multiplicité des niveaux de conception et de réalisation des systèmes d information, la multiplicité des modèles aux différentes étapes et peut être surtout le manque de règles de passage d un niveau à un autre, d un modèle à un autre ont gravement nuit à l utilisation complète de la méthode. Le modèle OOE 47 (Objet Opération Evénement) [ROLLAND et FOUCAUT, 1987] a été introduit en 1987 à partir des recherches sur la méthode REMORA et complété en 1996 par [FOUCAUT et THIERY, 1996a]. Le modèle OOE définit des règles de passage de la modélisation conceptuelle à la modélisation logico-physique qui doivent permettre d aboutir à la liste des composants logiciels à programmer. Rappelons ici brièvement ce modèle et ses fondements : La catégorie OBJET représente les éléments concrets ou abstraits du système et de son environnement c est-à-dire l organisation. Par exemple une commande. La catégorie OPERATION représente les actions se déroulant dans le système ou ses soussystèmes. Par exemple, l analyse de la commande à la suite de sa saisie qui va modifier la quantité en stock du produit commandé. La catégorie EVENEMENT représente les faits survenant dans le système au cours du temps. Par exemple, l arrivée d une commande qui déclenche l analyse de la commande, la rupture de stock caractérisée par le fait que la quantité en stock est devenue inférieure à un certain stock. 45 OMT : Object Modeling Technique.Signifie technique de modélisation objet. 46 UML : UnifiedModeling Language/Langage unifié pour la modélisation. 47 Objet Opération Evénement : dynamique causale car les mêmes causes produisent toujours les mêmes effets. 91

94 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Dans cette approche l état du système est défini à un instant donné par l état des objets qui lui appartiennent à cet instant. Le système évolue au cours du temps à la suite de l exécution d opérations qui sont déclenchées par des événements internes ou externes au système. Les opérations agissent sur les objets et provoquent des changements d état qui à leur tour peuvent être des événements. Cette interaction entre les trois catégories de phénomènes est illustrée par la figure suivante : OBJETS Correspondent à des changements d état EVENEMENTS Modifient Déclenchent OPERATIONS Figure : Dynamique causale La puissance de cette proposition réside en l intégration des concepts que montre cette figure. On l appelle la dynamique causale car les mêmes causes produisent toujours les mêmes effets. Ceci vient à l origine de la méthode REMORA qui a fait date au niveau mondial dans le monde des méthodes de conception des systèmes d information bien avant que cela ne devienne une évidence. Dès les années 70 [THIERY, 1976], les membres de l équipe REMORA [ROLLAND et FOUCAUT, 1978] propose une modélisation reposant sur des concepts simples qui permettent ensuite non seulement de construire la base de données quasiment automatiquement mais aussi de construire l ensemble des transactions sur la base de données par des règles de passage de la solution conceptuelle (à partir des événements et des opérations). L idée avancée par l équipe SITE est que les systèmes d informations stratégiques sont des systèmes d information particuliers et que la modélisation proposée précédemment peut s adapter à ces nouveaux systèmes d information. Cependant la conception de système d information stratégique nécessite une démarche de conception particulière et une modélisation complexe. Toutefois l idée sous-jacente de modélisation fondée sur le minimum de concepts réutilisables à chaque étape de la démarche paraît tout à fait réaliste. 92

95 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Les entrepôts de données et les systèmes d informations stratégiques Préambule Nos considérons l entrepôt de données, comme un support au système d information décisionnel et aux outils de fouille de données, permettant d extraire de nouvelles connaissances. De nombreux moyens informatiques sont aujourd hui mis en oeuvre pour aider les organes de décision des organisations. L informatique de gestion a gagné sa place dans l entreprise depuis les années 60 par une succession de progrès technologiques, logiciels et méthodologiques qui ont tous contribué à une réduction des coûts d exploitation. L invention du compilateur et de la compatibilité des séries de machines dans les années 60 a permis aux grands comptes de s équiper. Le microprocesseur et les bases de données dans les années 70 ont rendu l informatisation accessible aux moyennes et grandes entreprises. Les bases de données relationnelles, les progiciels de gestion, ainsi que les premiers micro-ordinateurs des années 80 ont largement contribué à l équipement des petites et moyennes entreprises, commerces, administrations. Jusque là, la plus grande partie des applications était dédiée au traitement des données directement liées à l activité quotidienne des organisations : paie, comptabilité, commandes, facturation. On regroupe ces applications sous le terme d Informatique de Production ou d Informatique Opérationnelle. L architecture générale était l architecture maître-esclave, avec le maître, un puissant ordinateur (mini ou gros système) en site central et les esclaves, terminaux passifs en mode texte. L organisation de l entreprise était très hiérarchisée dans sa structure informatique et sa structure de pilotage. Des techniques d aide à la décision ont été mises en place. Elles sont essentiellement fondées sur des outils de simulation et d optimisation, parfois sur des systèmes experts. La mise en œuvre de ces techniques nécessitait l intervention d équipes d informaticiens pour le développement de produits spécifiques. Ces outils étaient mal intégrés dans le système d information. Avec l apparition des ordinateurs personnels et des réseaux locaux, une autre activité a émergé, tout à fait distincte de l informatique de production. Dans les secrétariats, les cabinets, on utilise des tableurs et des logiciels de traitements de texte, des petites bases de 93

96 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information données sur des machines aux interfaces graphiques plus agréables. Jusqu aux années 90, ces deux mondes bureautique/informatique se sont ignorés. La montée en puissance des micro-ordinateurs et l avènement de l architecture client-serveur a permis un décloisonnement remarquable entre bureautique et informatique. Le but principal est de fournir à tout utilisateur reconnu et autorisé, les informations nécessaires à son travail. Cette nouvelle approche de l information fait naître une nouvelle informatique, intégrante, orientée vers les utilisateurs et les centres de décision des organisations. C est l ère du clientserveur qui prend vraiment tout son essor à la fin des années 90 avec le développement des technologies Intranet. Les définitions, les objectifs, l architecture et la conception de l entrepôt de données dans les chapitres qui suivent vont nous montrer que l entrepôt de données est un puissant outil de reporting. Les paragraphes suivants permettent de concrétiser toutes les difficultés de la mise en œuvre d un datawarehouse. Les entrepôts de données sont devenus maintenant non pas un phénomène de mode mais un instrument indispensable à la bonne marche de l organisation. Ils sont en effet à la base de toute stratégie et prise de décision de l entreprise. Ainsi 95% du top 500 des entreprises aux USA ont mis en place un data warehouse ou entrepôt de données 48, à l origine essentiellement destiné au marketing. Le concept de Data Warehouse Le concept de data warehouse [THIERYa] est une base de données organisée pour répondre aux besoins spécifiques de la prise de décision. Cette base contient des informations historiques sur l entreprise, son fonctionnement et son environnement. Elle est alimentée à partir des bases de production et d informations externes à l entreprise. Elle est thématique, relative à un domaine intéressant le décideur possédant une référence temporelle, sûre c est à dire dont la qualité a été vérifiée, facile d accès, non volatile et régulièrement complétée. En fait, l entrepôt de données est une vue intégrée de l organisation. Il est le noyau du système d information stratégique. D après [INMON, 1997] «Le Data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d un processus d aide à la décision». Il fournit de l information : 48 J.M. Franco, Le Data Wharehouse : objectifs, définitions, architectures, Eyrolles

97 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Thématique, c est à dire relative à un domaine intéressant le décideur possédant une référence temporelle, Sûre, c est à dire dont la qualité a été vérifiée selon [LESCA et LESCA, 1995] et [BRIARD, 2000], Facile d accès, Non volatile, car régulièrement complétée et «nettoyée» rarement. Ce que l on demande aux outils actuels c est de permettre une extraction fiable des données du système d information pour construire le système d information stratégique et, aussi bien sûr, des possibilités d exploitation bien meilleures qu avec les environnements informatiques existants. Différents types de données manipulées par un Data Warehouse J.-M. Franco [FRANCO, 1997b] détaille et complète les notions abordées par la définition d Inmon, William H sur les données. Les données peuvent être : Détaillées, c est à dire issues des bases de données de production. Elles reflètent les événements les plus récents. Des intégrations régulières de données issues des systèmes de production sont réalisées à ce niveau. Par exemple le nombre d étudiants inscrits au cours du mois de janvier Orientées sujet, les données sont organisées par thèmes et non pas par processus fonctionnels, comme c est l habitude dans les organisations traditionnelles. L intérêt est de disposer de l ensemble des informations sur un sujet le plus souvent transversal aux structures fonctionnelles de l entreprise. Cette approche permet également de développer le système décisionnel via une démarche incrémentale sujet après sujet. Données intégrées, afin d assurer la présentation de données homogènes, celles-ci doivent être mises en forme et unifiées afin d avoir un état cohérent. Une donnée doit avoir une description et un codage uniques. Cette phase d unification, qui d apparence est simple, est en réalité complexe du fait de l hétérogénéité des bases de données. Données historisées, dans un système de production, la donnée est sans cesse mise à jour : à chaque nouvelle transaction. L ancienne valeur est perdue. Ces systèmes conservent assez rarement un historique des données. Dans un entrepôt de données, la donnée ne doit jamais 95

98 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information être mise à jour. Elle représente une valeur insérée à un certain moment. Cette démarche induit la gestion d un référentiel de temps associé à la donnée pour l identification de cette donnée. Données non volatiles, c est une conséquence de l historisation décrite ci-dessus. Agrégées, ce sont des résultats et des synthèses d analyse, accessibles à tous, et correspondant à des éléments d analyse représentatifs des besoins utilisateurs. Elles constituent déjà un résultat d analyse et une synthèse de l information contenue dans le système décisionnel, et doivent être facilement accessibles et compréhensibles. Par exemple le nombre d emprunts de documents de la semaine, du mois, le nombre d emprunts de document moyen par mois sur les deux dernières années. Fortement agrégées, enfin elles peuvent être fortement agrégées et complétées par des métas données qui explicitent les règles d agrégation. Les objectifs d un entrepôt de données Un environnement de concurrence plus pressant contribue à révéler l informatique décisionnelle. Tout utilisateur de l organisation ayant à prendre des décisions doit pouvoir accéder en temps réel aux données de l institution. Il doit pouvoir traiter ces données, extraire l information pertinente de ces données pour prendre les bonnes décisions. Par exemple, au sein d une université, les questions peuvent varier en fonction des utilisateurs qui interrogent le système d information. Quels sont les taux de réussites aux examens? Quelle est l évolution des étudiants inscrits dans telle filière au cours du temps? La documentation acquise dans tel domaine est-elle proportionnelle au nombre d inscrits? Par qui est empruntée cette documentation - des étudiants inscrits à l université de rattachement du centre de documentation? ou encore - les emprunts satisfont-ils également des étudiants d autres universités? Quels sont les périodes d emprunt par rapport aux types de documents empruntés? Quels sont les services, offerts via un portail documentaire ou universitaire, les plus utilisés? On le voit, on peut aisément répondre à certaines questions et ne pas pouvoir le faire dans tous les cas, car le système opérationnel ne permet pas de répondre aux besoins des utilisateurs. Les bases de données opérationnelles sont trop complexes pour pouvoir être appréhendées facilement par tout utilisateur. De plus le système opérationnel ne peut pas être interrompu pour répondre à des questions nécessitant des temps de calcul importants. 96

99 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Il s avère donc nécessaire de développer des systèmes d information orientés vers la décision. Il faut garder un historique et restructurer les données, éventuellement récupérer des informations démographiques, géographiques et sociologiques. Les entrepôts de données ou data warehouse sont la réalisation de ces nouveaux systèmes d information Bases métiers ou data marts Un entrepôt de données donne naissance, par filtrage non plus par rapport aux dimensions mais par rapport à des profils utilisateurs, à des data marts ou bases métiers. Ce sont des sous bases du Data Warehouse destinées à une fonction de l entreprise ou de l institution : service des ressources humaines, services financiers, services administratifs, services pédagogiques ou encore services documentaires. Elles sont alimentées périodiquement, elles reposent sur une vue multidimensionnelle des données, enfin elles sont non modifiables par les utilisateurs. Les bases de données métiers permettent : Un pré calcul des agrégats à tous les niveaux, en fait les outils SIS utilisent les algorithmes reposant sur des matrices creuses (c est à dire comportant beaucoup de 0) qui permettent de stocker puis de retrouver uniquement les résultats intéressants ; Une séparation des données quantitatives des données qualitatives, si tant est que l outil puisse modéliser ces dernières ; Une souplesse dans la définition des dimensions : par exemple on peut rajouter un niveau semestre à la dimension temps. Ceci dit, il faudra bien sûr re-générer l hypercube car les résultats pré agrégés du niveau semestre seront à calculer. Enfin et peut être surtout, ce type de structure, et bien sûr les outils d exploitation associés, permettent de se «promener» dans les données aisément, ce que l on appelle le «data surfing». Le data surfing c est la possibilité donnée au décideur de naviguer de manière ergonomique et intuitive dans un modèle multidimensionnel. Les décideurs auront une vision différente des données et souhaiteront que leur soient proposées uniquement les données qui sont utiles à la réponse de leur besoin. Au lieu de calculer ce besoin, nous proposons d en intégrer la représentation dans le modèle de l utilisateur, ce qui constitue l originalité de nos propositions. Cela revient dans un S-IS à stocker parmi les métas-données du système, une représentation explicite de la structure des différentes bases métiers. Notre préoccupation principale est donc la prise en compte de l acteur dans la construction puis l exploitation d entrepôts de données. En effet actuellement 97

100 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information rien n existe vraiment dans le domaine ni dans les systèmes d entreprises (y compris dans les outils de Gestion de Relations Clients (GRC) ou de personnalisation du e-business), ni dans les recherches en cours sur les S-IS. Quels sont les enjeux d un data warehouse? Odile Thiéry propose une démarche pour révéler les enjeux d un data warehouse [THIERYa]. Il doit permettre de transformer les données contenues dans le système d information en données pertinentes. Cela pose des problèmes d extraction des données, de vérification de leur qualité mais aussi de personnalisation des informations. Il doit aussi fournir un environnement facilitant l analyse des informations utiles au décideur. Il doit l aider à découvrir les supports de décisions stratégiques afin d aider à une analyse décisionnelle. En effet avec un SI-S 49 on réalise des statistiques des rapports à la demande du décideur. En revanche avec un S-IS 50 nous cherchons des tendances à mettre en évidence. L entreposage de données et la fouille de données constituent de nouvelles technologies de pointe pour la gestion et l analyse de très grandes quantités de données. Les applications d entreposage de données transforment différentes sources de données en un modèle intégré multidimensionnel. Les programmes de traitement analytique en ligne peuvent aider à mettre en relief les tendances et les attentes des utilisateurs. Ceci permet de rentrer dans un processus d anticipation pour améliorer les réponses du système d information. Les systèmes d information peuvent être stratégiques sous deux angles [TARDIEU et GUTHMANN, 1991]. D une part tous les systèmes d information actuels des organisations comportent des informations stratégiques et permettent l automatisation de l organisation pour satisfaire au mieux les objectifs stratégiques de la direction. Exemple : un système d information améliorant la gestion des acquisitions de documents dans un établissement documentaire, élaboration à partir de résultats comptables de tableaux récapitulatifs en Excel. C est ce que l on appelle des SI-S (système d information stratégique). D autre part de plus en plus de systèmes d information sont dédiés uniquement à la prise de décision. 49 SI-S : systèmes d information stratégique 50 S-IS : système d informations stratégiques 98

101 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Exemple : un système d information d aide au choix des disciplines à couvrir dans un centre de documentation. C est ce que l on appelle des S-IS (système d informations stratégiques). Là c est le système d information dans son entier qui est consacré aux décisions stratégiques et ne comporte que des informations de type stratégiques. Exemple évolution du coût des acquisitions par type de documents sur plusieurs années. Nous nous intéressons ici aux S-IS c est à dire aux systèmes d information de deuxième type, ceux qui sont directement dans les préoccupations des chercheurs en Intelligence Economique. La Figure représente les deux types de système d information, l entrepôt de données réalisant la jonction entre les deux. Extraction Extraction SI de l Entreprise Schéma de l entrepôt relationnel Schéma des BDM SI-S S-IS Concepteurs Figure : Représentation du SI-S et du S-IS Cette figure montre que le système d information de l entreprise est le premier à être construit, il est divers et varié. Il comporte des informations stratégiques. Exemple des indications de répartition budgétaire. Il faut en extraire les informations nécessaires à la prise de décision et également leur structure (ce que l on appelle les métas données). Ceci constitue l entrepôt relationnel (appelé ainsi car il est actuellement géré par un SGBD relationnel). De cet entrepôt sont extraites des bases de données multidimensionnelles, appelées ainsi car elles permettent de regarder l organisation sous différents angles ou dimensions. Par exemple sur l axe temps ou quantité d étudiants ou encore nombre de matières. 99

102 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Ces bases de données multidimensionnelles constituent ce que l on appelle le système d informations stratégiques, en effet elles ne sont constituées que de données propres à la décision. Exemples de SI-S Un SI améliorant la gestion des inscriptions des étudiants pour ne l identifier qu une seule fois ; c est un choix stratégique, Un SI améliorant la communication interne dans l université par la mise en place d outils de partage, Un SI diminuant les erreurs de saisie par la mise en place d un récupérateur de données de façon automatique comme la carte à puce et son lecteur approprié. Exemples de S-IS Un SI gérant des tableaux de bord par exemple dans un service de comptabilité, Un SI d analyse de situations financières d une UFR d Université, Un SI de gestion de services à l égard de l utilisateur interne ou externe, c est-à-dire un professionnel ou un usager. Aujourd hui s il y a beaucoup de SI-S les S-IS sont encore relativement peu nombreux. Pourtant, dès le milieu des années 90, les entreprises possédaient des bases de données et des systèmes d information relativement complets quoique souvent non historiques car établis à partir des bases de données de production. D autre part la recherche en particulier mathématique a proposé de nombreuses méthodes d aide à la décision et de modélisation du processus de fouille de données mais en fait les décideurs utilisaient peu l informatique. Pourquoi? Tout d abord les informations contenues dans les bases de données étaient relativement peu accessibles malgré le standard d interrogation SQL 51. En effet, il faut être relativement spécialiste pour parler SQL couramment. Ensuite les tableurs tels que Excel suffisent à satisfaire de nombreux besoins et enfin les SIAD (systèmes d aide à la décision interactifs ou intelligents) restent souvent à l état de prototype [PEAUCELLE, 1999]. 51 SQL : Structured query language. 100

103 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information En conclusion, c est justement pour ces raisons d imperfections de l existant que la philosophie des S-IS a été entièrement revue, tenant compte beaucoup plus de l intervention et de la modélisation du décideur dans le processus de décision, l outil n étant là que pour l aider à découvrir de nouvelles informations sans rien imposer. C est à ce prix que cette nouvelle génération d outils s imposera et c est à cela que nous nous employons dans nos recherches L existant dans le contexte universitaire Paysage documentaire en réseau En juin 1999, un rapport sur Bibliothèques Universitaires et Nouvelles Technologies émanant de Bruno Van Dooren a été remis au ministre de l éducation nationale, de la recherche et de la technologie pour donner des recommandations à la réalisation d un système d information documentaire (SIDOC). Ce rapport propose trois niveaux de programme : organiser la production des documents électroniques, organiser la diffusion de l information électronique et organiser les conditions d usage des technologies de l information. Les objectifs autour de l organisation de la production des documents électroniques concernaient le signalement des collections des universités françaises, le signalement des contenus, la constitution de corpus de références de textes numérisés, la préservation et la communication du patrimoine écrit et graphique des universités, la valorisation de la production des universitaires. Les objectifs autour de l organisation de la diffusion de l information électronique concernaient la création dans chaque université d un système d information documentaire accessible par le web, l accès du public universitaire aux ressources électroniques, la virtualisation de l université par la numérisation d outils pédagogiques, la valorisation des sites web des universités françaises. Les objectifs autour de l organisation des conditions d usage des technologies de l information concernaient la familiarisation des étudiants à l outil informatique, l apprentissage de la recherche d information pertinente, l appropriation par les enseignantschercheurs des outils d informatique documentaire, le développement d une recherche nationale sur la documentation électronique. 101

104 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Une grande culture du travail en réseau reposant sur les normes et les standards préside dans l organisation du travail dans les bibliothèques. Depuis le début des années 2000 plusieurs projets révèlent le paysage documentaire. Le SUDOC 52 et les initiatives des archives ouvertes concrétisent le souci à mutualiser des services dans un souci de cohérence de gestion, de rationalisation des coûts, de partage des compétences. SUDOC En 2001, l Agence Bibliographique de l Enseignement Supérieur déploie le SUDOC dans les établissements de l enseignement supérieur. Les échanges de données entre le catalogue du Sudoc et les systèmes locaux de gestion de bibliothèque (SIGB) permettent aux bibliothèques du réseau de récupérer dans leur système local les notices qu elles produisent ou localisent dans le catalogue collectif. Actuellement 160 établissements (SCD, SICD, BU et BIU, bibliothèques de grands établissements ou de grandes écoles, bibliothèques CADIST ainsi que quelques établissements participent à l ensemble des applicatifs du réseau et au signalement de l ensemble de leurs documents. Ils regroupent 960 bibliothèques. Le réseau se compose en outre et uniquement pour le signalement des publications en série, d environ 2000 bibliothèques et centres de documentation supplémentaires. Parallèlement au catalogue SUDOC, des services dérivés ont été développés dans le portail SUDOC. Le portail documentaire SUDOC a pour vocation première de faciliter l accès à un large éventail de ressources utiles pour la recherche et l enseignement supérieur. Là où un catalogue collectif comme le catalogue SUDOC vise avant tout à signaler et à localiser tous types de ressources, le portail SUDOC donne la priorité aux ressources en ligne. L objectif est de donner accès au contenu des documents. En tant que portail documentaire à échelle nationale, il présente deux faces complémentaires. D un côté, il permet d offrir aux étudiants, aux enseignants et aux chercheurs un accès unifié aux ressources en ligne dont ils ont besoin, qu elles soient en accès libre ou qu elles aient été acquises par leur établissement d appartenance, et donc accessibles à leur seul établissement. D un autre côté, le portail SUDOC vise à donner une visibilité nationale et internationale aux documents produits ou publiés par les établissements de l enseignement supérieur et de la recherche français qui le souhaitent. 52 SUDOC : Système Universitaire de Documentation 102

105 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information En tant que guichet unique sur le web, le portail SUDOC entend faciliter les recherches des étudiants, des enseignants et des chercheurs, en France et à l étranger. En tant que fournisseur de données et de services, il aspire à enrichir les applications locales des établissements d enseignement et de recherche. Le portail SUDOC est une interface de recherche fédérée. La recherche fédérée permet d interroger de manière homogène des bases hétérogènes. Elles sont hétérogènes à différents égards : par leur contenu : certaines bases ne contiennent que des métas données (catalogues, bibliographies ), d autres donnent accès aux documents primaires (textes, images ). par leur statut : certaines bases sont en accès libre, d autres sont réservées aux abonnés. Pour d autres encore, l accès aux métas données est libre, mais l accès aux documents décrits par les métas données nécessite un abonnement. par leurs fonctionnalités de recherche : certaines proposent de nombreux tris et index (y compris sur le texte intégral), d autres ont des fonctionnalités plus pauvres. par leur localisation : certaines bases sont externes au portail, d autres sont gérées en interne. par leur mode d interrogation : différents protocoles d interrogation sont employés (Z39.50, SRW/U, http ). La priorité du portail SUDOC est de donner accès aux documents primaires et de permettre une interrogation sur le texte intégral de ces documents. Cette interrogation ne se limite pas aux documents PDF ou HTML. Le portail est capable d indexer des documents structurés (en XML) pour offrir des index ciblés sur différentes parties du texte intégral (table des matières, bibliographie, notes ). En collaboration avec le groupe technique du consortium Couperin, le module APE (Accès aux Périodiques Electroniques) a été développé dans une logique conforme à celle du portail, notamment en ce qui concerne la gestion des identifiants. Cet outil a pour objectif de permettre aux utilisateurs d accéder plus facilement aux périodiques électroniques auxquels leur établissement est abonné. Depuis avril 2005, le CRU (Comité Réseau des Universités) réalise une expérimentation pilote pour le compte des établissements d enseignement supérieur français souhaitant mettre en place un service de fournisseur d identités et/ou de fournisseur de services. L objectif de ce service est de «faciliter le partage de ressources numériques en ligne entre établissements 103

106 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information d enseignement supérieur en interconnectant leurs services d authentification. Il devient possible d ouvrir l accès à une ressource numérique (pédagogique, scientifique, etc.) à une population identifiée, sans devoir gérer localement l enregistrement des utilisateurs. ( )». Le produit choisi pour cette expérimentation est Shibboleth, une application Open Source, bien adaptée au contexte universitaire. Dans le cadre du catalogue SUDOC, les membres du réseau dispose d un système de pilotage qui permet un certain nombre de statistiques d activités (consultation, catalogage, PEB, consultation des bases, utilisation des services et provenance des utilisateurs. ). Pour les établissements qui disposent d un serveur OAI-PMH, ils peuvent valoriser leurs ressources locales. Le protocole OAI-PMH est un protocole web qui permet d échanger simplement des données XML dans la plupart des cas, des notices Dublin Core. En utilisant un protocole et un format (Dublin Core) standards, chaque établissement est assuré de pouvoir coopérer non seulement avec le portail SUDOC, mais aussi avec d autres partenaires. Pour les établissements qui le souhaitent, le portail SUDOC propose l indexation automatique du texte intégral, en complément du moissonnage des métas données. En cohérence avec les missions de l ABES, il est accordé une attention toute particulière aux thèses, en particulier aux thèses françaises. Dans le cadre du prochain circuit national des thèses électroniques, fonctionnel en 2006, et avec l accord de l établissement de soutenance, le portail SUDOC pourra, à partir du signalement des thèses électroniques dans le catalogue SUDOC, indexer et donner accès automatiquement à celles-ci, qu il récupérera de l application STAR. Ce service n exigera de l établissement de soutenance aucune démarche particulière, hormis un accord express Existant des systèmes d information documentaires Comment échanger des données dans le cadre d un réseau documentaire sans contraintes techniques liées à leur format [DALBIN, 2003]? Comment changer de système informatique de façon simple et fiable? Comment intégrer des documents bureautiques dans un système documentaire? Comment améliorer les performances d un système de recherche? Parce qu elle garantit la préservation des données, parce qu elle en facilite l échange et la recherche, la modélisation des données apporte des réponses à ces questions : c est ce que se proposait de montrer une journée d étude organisée par l ADBS à Paris le 20 mai

107 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Plusieurs facteurs modifient considérablement le contexte de développement des systèmes d information documentaire (SID). Leur ouverture vers d autres systèmes, documentaires ou non documentaires (gestion des droits par exemple), la complexité et la grande variété des usages, des ressources et des acteurs à prendre en compte, le passage de la notion de document à celle d objet d information numérique constituent des éléments à prendre en compte pour le développement des systèmes d information documentaire. Ils constituent une rupture dans les techniques utilisées, malgré une continuité et un élargissement des missions des professionnels de l information-documentation. Ce contexte nous amène aujourd hui à considérer la modélisation comme indispensable dans nos démarches de conception des SID Différents modèles L OAIS ou Open Archival Information System constitue un modèle de référence pour un système ouvert d archivage d information. L OAIS est un cadre conceptuel et terminologique pour l implantation de système de gestion de ressources numériques dans le but d en assurer la préservation et l accessibilité à long terme. Il est l aboutissement de réflexions menées à l apparition de problèmes inédits : les risques de perte de données liés à l obsolescence des technologies (codage ou supports). Issu du monde des archives du secteur de l aéronautique, l OAIS est devenu en 2002 une norme (ISO : 2002) adoptée par tous les programmes de préservation et d accès à long terme des bibliothèques. L enjeu est de taille puisqu il est question de la préservation de ressources électroniques, pour leur mise à disposition future, avec toutes les données permettant d en assurer la lecture - quels que soient les problèmes (techniques, juridiques, etc.) qui peuvent se poser dans l avenir. Le modèle OAIS Ce cadre définit deux modèles complémentaires : un modèle fonctionnel et un modèle d information, indépendants de produits commerciaux. Le modèle fonctionnel de l OAIS emprunte au modèle d un SGED (système de gestion électronique de document) un découpage en cinq grandes fonctions : production, versement, stockage et préservation, utilisation, et rajoute une couche administration et accès. Les traitements et sous-traitements opérés tout au long de cette chaîne créent des contraintes techniques que le travail d abstraction a permis de modéliser, puis de documenter à l aide de métas données spécifiques. Cette chaîne a été représentée selon un modèle par couches où 105

108 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information chacune constitue un traitement qui rend un service à la couche immédiatement supérieure et sur lequel opère le sous traitement suivant de la chaîne. À chaque couche sont associés des sous traitements et des catégories de métas données. Le modèle d information, quant à lui, manipule des objets d information et s appuie sur la notion de paquet d information d archivage (archivage information package ou AIP). Le véritable objet est ici le contenu informationnel dont l intelligibilité doit être préservée, et ceci quel que soit l environnement technique dans lequel on se trouve. Deux classes d objets d information principales, constituant les paquets d information d archives (PIA), ont été définies : l information contenue (IC) et l information complémentaire à la pérennisation (PDI). Ces deux premières classes fournissent le cadre pour la création des métas données de préservation. Elles sont associées à deux autres classes : l information d empaquetage qui correspond à l objet numérique accompagné des métas données relatives à son empaquetage sur un support spécifique et l information de description, facilitant l accès au contenu. Chaque classe d objets d information est également constituée d autres classes spécifiques. Par exemple, pour la classe PDI : l information de référence, de provenance (qui décrit l historique de l IC), contextuelle (relation entre l IC et son environnement), de fixité (mécanisme d authentification vérifiant que l IC n a pas été altérée). Avec cet exemple, on voit immédiatement que ce schéma est plus complexe mais plus riche et qu il vise à aborder la question de la pérennisation des ressources numériques de façon globale et dans le temps, en prenant en compte toutes les contraintes (volumes, flux, diversités des types d objets documentaires, etc.). Trois catégories de métas données complémentaires ont été définies : descriptives, administratives (gestion des objets composants y compris les informations techniques, gestion des droits d accès), et de structure (structure logique pour assembler les différents composants logiques, lien avec les objets numériques). Ces réflexions sur l oasis se sont traduites au plan national par la mise en place en 1999 d un groupe de travail, le PIN (pérennisation des informations numériques) qui regroupe des institutions techniques et scientifiques, des industriels, des organismes à vocation patrimoniale. Le modèle METS Le modèle METS (Meta data Encodage and Transmission Standard), réalisé à l initiative de la Digital Librairie Fédération (DLF), est une implémentation particulière du modèle de référence OAIS qui permet les échanges d objets numériques entre bibliothèques. METS est 106

109 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information un schéma XML permettant la création de documents METS en XML. Un document METS est composé de la description de la structure hiérarchique des objets numériques constituant une ressource numérique ; cette description répertorie tous les noms et localisations des fichiers, et toutes les métas données de structure, administratives et descriptives (Dublin Coire). Il est structuré en sept sections : header, descriptive metadata, administrative metadata, file group, structure map, structural links, behavior. La bibliothèque du Congrès aux États-Unis est actuellement l agence de maintenance de ce modèle. Il n a pas suffi d une démarche analytique de type descriptif autour des systèmes actuels pour établir ces modèles que nous venons de décrire. C est par un processus d abstraction que ces modèles ont pu être proposés. Selon Catherine Lupovici [LUPOVICI, 1999] la modélisation permet de faire évoluer la vision des ressources numériques, elles-mêmes étant un «tissu d objets d information liés entre eux» Développement du modèle OAI L OAI 53, Open Archive Initiative et les métas donnés Dublin Coire facilite l accès et l échange de documents. Ce protocole d échange permet de créer, d alimenter et de tenir à jour, par des procédures automatisées, des réservoirs d enregistrements qui signalent, décrivent et rendent accessibles des documents, sans les dupliquer ni modifier leur localisation d origine. Dans un contexte en forte évolution (accélération de la recherche, développement des réseaux, web, baisse de popularité des éditeurs commerciaux), la publication scientifique vit une période de changement en ce qui concerne la production et la publication électroniques. De nombreux modèles alternatifs se sont développés, mais ils restent indépendants les uns des autres et ne permettent pas une synergie entre les collections. Lors d une convention à Santa Fé en 1999, des professionnels ont décidé de développer un «cadre général pour la fédération de contenus sur le web». Deux solutions ont été présentées : interroger simultanément des bases hétérogènes et réparties selon le protocole Z ou collecter massivement les métas données dans un ou plusieurs réservoirs centraux. L intérêt pour cette dernière formule s est développé dans les 53 site officiel du protocol 54 Z3950 : est une norme américaine de la NISO4 (National information standard organisation) finalement reconnue et adoptée par l'iso en mars 1997 sous le nom de ISO Z39.50 est développée et mise à jour par le ZIG5 (Z39.50 Implementers Group) groupe international et informel et suivie de près par la Bibliothèque du congrès (Z39.50 maintenance agency6) L'invention de Z39.50 date de la fin des années

110 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information musées et bibliothèques, et a abouti en septembre 2000 à une formalisation de l Open Archive Initiative. Ces travaux ont abouti à la mise au point d un protocole de collecte et de mise à disposition de métas données : l OAI-PMH 55 (protocol for metadata harvesting, ou Protocole de collecte de métas données de l initiative Archives ouvertes) [OAIP], dont une deuxième version est sortie en juin L objectif est de découvrir, présenter et analyser le contenu d une archive, quel que soit son contenu, pour la mettre largement à disposition. L OAI-PMH facilite la description et la diffusion des métas données d articles scientifiques disponibles en accès ouvert sur Internet, notamment dans des répertoires de pré-publications. Il s est vite révélé très adapté au partage de métas données de documents scientifiques ou culturels, présentes dans des ensembles de ressources homogènes ou hétérogènes, plus ou moins réparties. Le modèle de données sous-jacent se découpe en trois niveaux : la ressource (objet physique auquel on peut rattacher des métas données), un item (objet documentaire et toutes les métas données), un enregistrement (un format de métas données issu d un item, un identifiant, une date de création ou de mise à jour). Les métas données sont décrites obligatoirement selon le Dublin Core, mais d autres formats sont possibles et décrits par des schémas XML 56. Le modèle fonctionnel détermine deux catégories d acteurs : 1. les fournisseurs de données ou plutôt de métas données qui mettent en place une application informatique compatible avec le protocole OAI-PMH. De nombreux fournisseurs de données OAI 57 sont déjà opérationnels. On peut citer par exemple des réservoirs en chimie ou dans le domaine des sciences de la vie ou encore en France le Centre pour la communication scientifique directe du CNRS 2. les fournisseurs de services qui localisent les fournisseurs de données et collectent leurs métas données de manière automatique et incrémentale. Des informations sur la provenance sont ajoutées aux métas données, permettant des traitements à valeur ajoutée sous la forme de services : recherche, personnalisation ou alerte. 55 OAI-PMH : The Open Archives Initiative Protocol for Metadata Harvesting 56 XML : Extensible Markup Language 57 OAI : Open Archive Initiative 108

111 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Ce protocole est un réel succès en raison d une part de la simplicité du protocole, d autre part d une relation avec le mouvement «ouvert» ou «open access», et enfin des possibilités qu il offre en termes de constitution d archives et de catalogues collectifs, de développement de sites portails et de façon plus générale de transport et d échange de métas données. Ce modèle poursuit son développement avec des extensions techniques et fonctionnelles, comme les projets d incorporation de la gestion de la certification ou des droits. Grâce au protocole OAI, une bibliothèque agissant en tant que fournisseur de données a la possibilité d offrir une visibilité accrue à ses documents, notamment à ses publications électroniques ou à ses fonds spécialisés. Réciproquement, en tant que fournisseur de service, une bibliothèque peut réaliser une base de données ou un portail documentaire dans son domaine de spécialité ou sur un thème quelconque, en collectant les données descriptives de ressources et documents de tous types, accessibles sur l Internet dans des entrepôts OAI. Enfin, le protocole OAI permet de faire communiquer entre elles des bases de données diverses et hétérogènes, et donc de réaliser des partenariats entre plusieurs établissements. Les principes conceptuels Le protocole OAI s appuie sur quelques concepts documentaires simples : la ressource, qui est le document-objet décrit, réel (exemple : un livre) ou virtuel (une image numérique, un texte électronique), l item, qui est la fiche ou la notice informatique décrivant cet objet (exemple : une notice bibliographique en format UNIMARC), et qui contient ou génère des métas données échangeables pour le protocole OAI, à la seule condition qu un identifiant unique, construit selon les recommandations de l Open Archive Initiative, puisse être attribué à l item dans la base qui le contient, l enregistrement (record), qui est un ensemble de métas données extraites d un item dans un format XML, et qui fait l objet de l échange entre l entrepôt et le moissonneur (exemple : la description du livre en format BiblioML ou Dublin Core) ; il y a autant d enregistrements possibles par item que de formats dans lesquels l entrepôt est moissonnable. 109

112 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Les principes organisationnels Dans ce contexte, le protocole définit le langage par lequel communiquent le fournisseur de données (entrepôt) et le fournisseur de services (agrégateur), qui rassemble des données collectées par un moissonneur. Pour alimenter l agrégateur, le moissonneur visite plusieurs entrepôts, qu il doit interroger massivement une seule fois ou en plusieurs étapes, pour extraire les enregistrements des items qui l intéressent. Après la collecte, le moissonneur dépose les données dans une base que le fournisseur de services rend accessible à ses clients. L interrogation de cette base est directe et ne sollicite pas les entrepôts d origine. En effet, l utilisateur final interroge uniquement le réservoir de notices, constitué par moisson, du fournisseur de service, qui lui retourne en réponse la liste de notices pertinentes. Ces notices proposent notamment un lien hypertexte vers le document primaire, seulement accessible sur le serveur du fournisseur de données. Le choix du format d exposition des données Rendre une base documentaire (bibliothèque d images, base de thèses, base de prépublications ou catalogue de bibliothèque) compatible avec le protocole OAI ne demande pas de modifications profondes de sa structure ni des données qu elle contient : il suffit d ajouter une couche supplémentaire permettant d exposer ses objets documentaires selon des formats prescrits par l OAI, soit au minimum le Dublin Core ou tout autre format XML. À la requête ListMetadataformats d un moissonneur, l entrepôt doit pouvoir décliner la liste des formats disponibles avec l adresse à laquelle est accessible la DTD 58 ou le Schéma XML. L usage de l OAI-PMH dans le portail SUDOC Le moissonneur nourrit une base XML. Ainsi, le portail SUDOC de l Agence bibliographique de l enseignement supérieur (ABES) comporte une base XML alimentée soit par saisie directe, soit par moisson OAI, soit par des opérations de chargement en série. La constitution d une base XML pour les ressources électroniques ne remplace pas l interrogation de catalogues distants selon la norme Z39-50, mais vient compléter cette architecture pour des recherches fédérées. 58 DTD : Document Type Definition 110

113 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Protocole de communication par la fédération d identités Une fédération d identités est constituée de fournisseurs d identités et de fournisseurs de services. Un fournisseur d identités gère des utilisateurs (par exemple : une université), un fournisseur de services propose des services (par exemple : Elsevier). La relation entre les fournisseurs s établit sur le principe du choix d accès à des fournisseurs de services pour l un, du choix de donner l accès à des fournisseurs d accès pour l autre. La fédération établit et formalise le niveau de confiance minimal partagé entre les fournisseurs. La confiance accordée à un fournisseur d identités par un fournisseur de services est fondée sur la qualité de l authentification des utilisateurs, la qualité des attributs propagés et sur la disponibilité des services d authentification et de propagation d attributs. La confiance accordée à un fournisseur de services par un fournisseur d identités est fondée sur l assurance que les attributs propagés ne servent qu aux usages initialement prévus. En conséquence, la fédération d identités doit promouvoir une politique claire et volontariste s appuyant sur le respect des engagements des membres. Dans ce cadre, les fournisseurs d identités comme l Université Henri Poincaré, s engagent à utiliser un produit compatible Shibboleth, à sécuriser leur environnement logiciel (SSO 59, Espace Numérique de Travail, annuaire), à respecter la législation sur la protection des données. Le schéma de fonctionnement Shibboleth Figure : Shibboleth : schéma tiré de la réunion Couperin, CRU 2006 Actuellement, pour donner accès aux ressources électroniques, deux méthodes sont utilisées : des plages d adresses IP déclarées aux fournisseurs de services et Reverse proxy qui est une solution fonctionnelle et satisfaisante pour l utilisateur mais difficile à administrer. Ces 59 SSO : Single Sign-On 111

114 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information solutions permettent de donner accès aux ressources du réseau de l université mais sans authentification. Le principe est binaire : «accès» «pas d accès». Shibboleth est une solution plus fine qui permet de donner accès depuis n importe quel poste Internet puisque l utilisateur est renvoyé vers son Espace Numérique de Travail dans lequel il s authentifie et accède à la ressource ; aucune information personnelle n est envoyée au fournisseur de services. Shibboleth permet de : quantifier les accès pour un fournisseur donné, d identifier un utilisateur au comportement contraire aux conditions d utilisation du service, de suspendre l utilisation du service pour un utilisateur donné, d offrir un service à une population limitée (personnels, étudiants, enseignants-chercheurs, responsables ). Shibboleth s appuie sur des standards déjà déployés dans l établissement (annuaire, SSO, Espace Numérique de Travail), Shibboleth est un standard utilisable par d autres applications La brique documentaire d un environnement numérique de travail Une journée consacrée à la construction de la brique documentaire au sein d un environnement numérique de travail à Grenoble [GRENOBLE, 2005] au mois de novembre 2005, a permis de faire un état des lieux de la situation actuelle sur un plan national et international en bénéficiant de l éclairage des représentants de la Direction de l Enseignement Supérieur. Une présentation d une expérience à l étranger a montré l intérêt d avoir une démarche stratégique également orientée sur un plan international. L expérience et l expérimentation menées à Valenciennes apportent un témoignage quant à la mise en pratique d un ENT avec intégration de l aspect documentation. Des représentants de l INIST ont réaffirmé l importance à valoriser la production scientifique en tenant compte d une dimension nationale et surtout internationale. Marie-Thérèse Rebat [REBAT, 2005] de la sous-direction des bibliothèques et de la documentation, responsable des Systèmes d information documentaire des établissements a fait le panorama de la profession de la documentation au service de la recherche. Ses propositions concernent l intégration du système d information documentaire (SID) dans le système global de l université via l environnement numérique de travail pour aboutir au système global d information (SIG). Un ENT est un dispositif qui permet à tous les usagers de disposer des services en rapport avec leur activité à partir d un point unique, cela implique une réflexion globale sur l organisation en tenant compte des acteurs et des objectifs. 112

115 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Les Objectifs d un ENT : Favoriser la contribution à l apprentissage de l autonomie [PEGUIRON et DAVID et THIERY, 2003]. Simplifier les procédures administratives. Améliorer la circulation de l information. C est un espace qui doit permettre la mobilité physique et intellectuelle. Cela va en faveur de l idée de formation tout au long de la vie. Pour l élaboration de l intranet, il est nécessaire de dégager les besoins existants et les nouveaux besoins. Définir les modes d accès. Cela passe par une phase de typologie des usagers en les catégorisant et en intégrant l aspect «évolutif» [PEGUIRON et KISLIN et BOUAKA, 2003]. Les Services d un ENT : Des services communs accessibles par Ldap 60 reposant sur le protocole SSO 61 permettent une authentification. Les services proposés sont par exemple des outils de bureautique, un moteur de recherche, environnement , forum de discussions, agenda, stockage modulé, personnalisation via les RSS 62. Les briques «métiers» sont ajoutées par rapport aux services de la recherche documentaire, de la pédagogie ou encore de la scolarité. Qu est ce qu un Système d Information Global? C est la base de l ENT, développé dans le cadre d une université numérique en région ou d une université thématique. Le développement d un Système d Information Global (SIG s inscrit dans une démarche stratégique de l équipe présidentielle. Il concerne l organisation structurelle. L architecture fonctionnelle du SIG doit respecter les standards nationaux, européens et internationaux. Ce n est pas seulement un outil, mais une organisation structurelle. Il s agit de mettre en valeur l identité de l université et de permettre un accompagnement des usagers lors du processus de recherche documentaire. 60 Ldap : Lightweight Directory Access Protocol. Structure d'annuaire standard sur les réseaux TCP/IP 61 SSO : Single Sign-On, dispositif permettant à un utilisateur d accéder à des services divers en ne s identifiant qu une seule et unique fois 62 RSS : acronyme de Really Simple Syndication (syndication vraiment simple), ou de Rich Site Summary (Résumé complet d'un site) est un format de syndication de contenu Web 113

116 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Comment participer à la conception de l ENT de l université? La conception se fait à partir de briques métiers à partir de bases structurées. D où une nécessaire transversalité entre les acteurs, coordonnée par un comité de pilotage. Le comité de pilotage permet de valider les objectifs, proposer des financements, constituer les référentiels propres à l établissement. Le SIG est une mise en acte politique de l établissement. La mise en action de ce projet implique des outils de gestion de documents, de documents électroniques, des outils de publication et des tableaux de bord. La mise en oeuvre se fait de pair avec la mise en place d un «workflow management 63» ou encore d un Business Process Management System 64. Il y a plusieurs niveaux de respects des standards, notamment au niveau des protocoles : ISO Z39-50, OAI-PMH 65, SRU 66 -SRW 67 et au niveau des règles de gestion d un établissement LOLF 68. A titre d exemple, l université de Valenciennes s intègre à l ENT de l Université par l utilisation de référentiels. L environnement repose sur un système commun d authentification. La démarche de Valenciennes [SCD, 2005] se trouve résumée sur la figure suivante : Référentiel de Documents GED Moteur de recherche O A I Web LMS Ressources pédagogiques Thèses en ligne Pré-print Les recherches Compte lecteur Nouvelles acquisitions Informations profilées SID Gestion des groupes Portail des services Ressources par thèmes actualités Gestion de l identité SSO Référentiel utilisateurs Ldap Cerimes Figure : Intégration de la brique documentaire dans le SID de l Université de Valenciennes 63 Workflow management : Technique de management fondée sur le principe du workflow ou travail collaboratif. Le workflow management a pour but d'analyser, de modéliser, de simuler et d'améliorer les processus. 64 Business Process Management System : Système de contrôle de processus 65 OAI-PMH : Open Archive Initiative Protocol for Metadata Harvesting ou Protocole de Collecte de Métas données de l Initiative Archives Ouvertes 66 SRU : Search and Retrieve URL Service 67 SRW : Search Retrieve Web Service 68 LOLF : Loi organique relative aux lois de finances 114

117 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information Nous pouvons regarder du côté de l Illinois [FOULONNEAU, 2005] pour trouver des universités qui se sont regroupées pour coordonner une activité autour de l OAI. Leur recherche méthodologique et technique a abouti à une perception documentaire tournée autour de l interopérabilité et la réutilisation des données. Les cyberinfrastructures proposent des briques fonctionnelles articulées autour de services informatiques : messagerie, WIFI, stockage et une brique bibliothèque : catalogue en ligne, commande de documents, gestion des prêts. Une autre brique juxtaposée autour de la gestion de la pédagogie : calendrier, note, devoir à faire, gestion de la vie des personnels de l université. Ces briques ne sont pas interconnectées. Cette cyberinfrastructure permet l orientation des financements. Parallèlement, on trouve une autre cyberinfrastructure pour l éducation. Il s agit d un environnement d apprentissage virtuel reposant sur les jeux, la simulation et la modélisation. On trouve là, une stratégie de l information pour l enseignement : information brute ou des publications. Dans cette thématique, réside la problématique de la communauté du e-learning. La mise en œuvre des centres de ressources virtuelles s appuie sur les contenus : données selon un socle commun (masse critique réutilisable), intégration d outils de production (visualisation/transformation/exploitation). Les bibliothèques numériques sont construites en tenant compte de l interopérabilité des données d où une problématique technique autour de DC-LOM 69, Dublin Core Education, métas données descriptives, métas données de structure (objets complexes IMS 70 ). Cela aboutit à une question : comment partager des métas données au sein des bibliothèques? Une réponse peut être apportée au niveau de : la qualité des entrepôts, la qualité des données, la qualité des services. Il est nécessaire de repenser les métas données. La réflexion concerne les formats avec contrainte d avoir un schéma XML 71. Ainsi peut être pris en compte l aspect «contextualisation» d une ressource. D où la nécessité d une granularité dans la 69 LOM : Learning Object Metadata 70 IMS : Introduction to Metadata Standards 71 XML : Extensible Markup Language ou langage de balisage extensible 115

118 Partie I - Chapitre 2 Les Principes de gestion par les systèmes d information représentation des ressources qui prend en compte le contexte de l information (MODS 72 ) car il y a une multiplicité des métas données et une prolifération de normes. Que doit-on promouvoir? Avec quel Schéma? En conclusion, nous sommes face à une diversité d objets à traiter, d où la nécessité de revenir sur des principes fondamentaux comme effectuer une typologie des objets à traiter. Faire un travail sur les problèmes de normalisation, se ré-impliquer dans les standards. A ce stade, nous voyons bien que deux pistes évoluent en parallèle et qui prêtent à confusion. Il y a d une part la volonté de pouvoir interroger des bases hétérogènes et cela peut se faire effectivement par le développement d un moteur de recherche fédérée. D autre part, il y a la volonté de tirer parti de données existantes pour les intégrer dans un entrepôt de données en vue de permettre des bases métiers à des publics ciblés. Après cet éclaircissement nous pouvons dire que la seconde piste est privilégiée dans nos recherches. 72 MODS : Metadata Object Description Schema 116

119 Partie I - Chapitre 3 Les acteurs 117

120 118

121 Partie I - Chapitre 3 Les acteurs Si nous nous reportons aux données statistiques de la revue électronique Le Journal du Net 73 relatives aux chiffres-clés de l'internet et des nouvelles technologies en France et dans le monde (internautes, marchés, e-business...) nous pouvons nous poser la question de savoir ce que nous pouvons encore apporter comme «nouveauté» pour améliorer les systèmes d information. Cette question est renforcée par le nombre croissant de professionnels de l informatique, des sciences de l information et de la communication et de l intelligence économique formé et opérationnel au travers le monde. Nous menons nos recherches dans un domaine en pleine évolution qui met en scène des professionnels de mieux en mieux formés et performants et des systèmes d information recelant une quantité d information de mieux en mieux organisées. Nous nous apercevons également qu à chacune de nos idées, nous trouvons déjà une foultitude de solutions. Pour reprendre une métaphore qui consiste à dire : les causes produisent les mêmes effets, nous pourrions dire que des situations de recherche similaires produisent l émergence d idées nouvelles communes. Partant de ce postulat qui nous rassure un peu, nous prenons le parti de nous focaliser sur des domaines spécifiques autour des acteurs d un système d information tout en tenant compte des remarques d Alain Juillet qui lors d un entretien avec Nicolas Arpagian pour la revue 01 Net [O1NET, 2005] précise que «Nous manquons cruellement d'outils informatiques d'origine française ou européenne.» Dès le début de nos travaux de recherche, nous avons remarqué la nécessité de dissocier les processus de recherche d information par rapport à un système d information. Cette hypothèse de départ a été renforcée par l état de l art qui a mis en relief que l intelligence économique du point de vue «action» est une suite de processus où toutes les étapes sont en interaction. Par la dissociation, nous avons déjà pu mettre en évidence un raisonnement par niveaux (étudiants, enseignants et administratifs). De la même façon, nous allons nous attacher au comportement de ces acteurs par rapport aux fonctionnalités du système d information Processus de recherche d information par les acteurs Méthode des 4P Au cours de nos recherches de DEA [PEGUIRON, 2001] l analyse des pratiques et des tendances des utilisateurs lors de la recherche d information sur Internet nous a permis de mettre en évidence plusieurs points. La recherche d information devient performante après connaissance de la typologie des différents systèmes de recherche. Cette typologie favorise 73 Le Journal du Net : 119

122 Partie I - Chapitre 3 Les acteurs l adoption d une méthodologie de recherche que nous avons mise en évidence et qui repose sur la méthode des 4P que nous caractérisons par les systèmes Pull, Push, Prospective et Peer to Peer. La mise en perspective de cette méthodologie de recherche met en relief l utilisateur lors d un processus de recherche d information qui se décline selon trois niveaux : processus de recherche, systèmes de recherche, outil de recherche. Pull 74 L utilisateur fait la démarche d aller vers l information. Ce système procède de la navigation. L outil spécifique dans ce cas est le navigateur (Netscape, Internet explorer, Mozilla, Opera ). Consultation Les dictionnaires électroniques Les encyclopédies électroniques Les traducteurs électroniques Moteurs de recherche Banques de données Lieux et manifestations Les annuaires Les bases de données Les laboratoires de recherche Les moteurs à mots clés Les bases de brevets Les colloques Les métamoteurs Les bases de normes Les foires Les bases d archives ouvertes Les salons Tableau : Pull Push 75 L information arrive à l utilisateur. C est un système qui repose essentiellement sur l adresse électronique. L outil spécifique est dans ce cas la messagerie électronique (Les listes de discussion, les lettres de diffusion, les news, les systèmes d alerte ). Prospective 76 Le processus de prospective permet de détecter de nouvelles tendances, d identifier des réseaux d experts ou de mettre en évidence des risques. C est un système qui repose sur un système de veille. Des logiciels dédiés aux différents types de veille ou d analyse constituent l outil spécifique de ce processus (Agents intelligents, outils d aide à la prise de décision, cartographie ). 74 Pull : Mode classique de la recherche d'information sur les réseaux. L'utilisateur se connecte sur des serveurs et cherche l'information 75 Push : Mode nouveau de collecte d'informations sur Internet. En s'abonnant à des fournisseurs de contenu (des chaînes Web), l'information arrive directement sur la machine dès qu'elle est mise à jour et cela sans que l'utilisateur ait besoin d'aller la chercher. 76 Prospective : Mode de recherche d information pour rechercher les nouvelles tendances. 120

123 Partie I - Chapitre 3 Les acteurs Peer to Peer 77 Le Peer to Peer prône l échange de fichiers, la distribution des applications à travers des stations communicantes. Ce système repose sur une conception du partage de l information. Les logiciels de la génération point à point prônent la distribution décentralisée des requêtes et propagent en chaîne la recherche d information sur le réseau. Outils de navigation Pull P P Push Outils de messagerie Outils de partage P to P P P Prospective Outils de veille outil système processus système outil Figure : Mise en perspective de la méthode des 4P déclinée selon 3 niveaux : processus, système, outils Le modèle EQuA²te D après le modèle EQuA²te élaboré au sein de l équipe SITE [DAVID et THIERY, 2002], nous observons plusieurs processus dans le phénomène de la recherche d information dont nous tirons parti pour nos réflexions. Le modèle EQuA²te représente une situation de recherche d information qui implique les phases cognitives suivantes : L exploration du monde de l information => Explore L interrogation de la base de l information => Query L analyse de la base de l information => Analyse L annotation fondée sur différentes préférences => Annote Ce modèle utilise des verbes d action pour décrire différents stades de la recherche d information : explorer, questionner, analyser et annoter. Ces termes évoquent les 77 Peer to peer : Liaison poste à poste par opposition au modèle client-serveur. Dans ce type de réseau les ordinateurs sont connectés les uns aux autres sans passer par un serveur central. 121

124 Partie I - Chapitre 3 Les acteurs fonctionnalités sous-jacentes du système d information, de façon à pouvoir donner satisfaction à l utilisateur final. Nous tirons parti de ce modèle pour analyser les situations de nos différents acteurs en situation de recherche ou de production d information. Notre objectif [THIERY et DAVID, 2002] est de faire des propositions permettant de concevoir un SIS de qualité et répondant aux besoins des différents acteurs de l université. C est ici que nous rejoignons (ce qui est mal modélisé par le concept de bases métiers dans les outils actuels du marché), à savoir la modélisation de l utilisateur Le modèle utilisateur L objectif de la modélisation de l utilisateur est de pouvoir personnaliser les réponses du système. La modélisation de l utilisateur est la façon de représenter un utilisateur et ses comportements. Cela concerne également la façon d exploiter les connaissances dont nous disposons à son sujet. Trois catégories de modèle sont proposées : a) Le profil de l utilisateur où à un utilisateur est associée sa requête qui exprime son besoin. Dans ce contexte, le besoin de l utilisateur est relativement stable. Le profil est appliqué aux nouvelles informations afin de lui proposer les informations les plus pertinentes. b) Le modèle implicite de l utilisateur où le comportement et les préférences de l utilisateur sont déterminés d une manière implicite. Par exemple la visualisation d un document par l utilisateur peut être interprétée comme une adéquation du document par rapport à sa requête. c) Le modèle explicite de l utilisateur où le comportement et les préférences de l utilisateur sont également représentés mais selon les spécifications de l utilisateur. Par exemple, même si l utilisateur visualise un document, il faut qu il indique son opinion sur le degré de pertinence du document par rapport à sa requête. L exploitation d un profil de l utilisateur (a) est généralement individualisée. Le modèle implicite ou explicite (b) et (c) peut être individualisé ou traité par la méthode de stéréotype. Par la technique de stéréotypage, les utilisateurs sont regroupés dans des classes et une interprétation s applique à tous les utilisateurs de la classe. La représentation des paramètres cognitifs sur les utilisateurs, par exemple les paramètres nécessaires pour connaître le niveau de connaissance d un utilisateur pour une meilleure interprétation de sa requête, nécessite la sauvegarde du modèle de l utilisateur au travers des sessions et individualisé. 122

125 Partie I - Chapitre 3 Les acteurs [THIERY et DAVID, 2002] ont travaillé sur la personnalisation des réponses en système de recherche d information (SRI). Ils ont débuté par la modélisation de l élève dans un contexte d apprentissage humain à partir des images. Nous avons proposé un modèle explicite représenté par des paramètres cognitifs pour chaque élève. Le modèle cognitif est fondé sur les phases cognitives identifiées dans un processus d apprentissage humain. Quatre phases, qui correspondent à des niveaux d habitudes évocatives, ont été intégrées dans le modèle : La phase d observation : l apprenant prend connaissance de son environnement par le processus d observation, La phase d abstraction élémentaire : l apprenant désigne les objets observés par des mots, ce qui correspond également à une phase d acquisition de vocabulaire, La phase de symbolisation et de raisonnement : l apprenant emploie des vocabulaires spécialisés qui relèvent d un niveau d abstraction des concepts élevés, La phase de créativité : l apprenant découvre et s approprie des connaissances qui ne sont pas présentées d une manière explicite dans le système. Ce modèle a été transformé en un modèle de l utilisateur dans un cadre de recherche d information. Cette transformation a été facilitée par la similarité entre la démarche d un utilisateur en recherche d information et celle d un apprenant. Le modèle de l utilisateur permet de proposer une architecture de SI qui repose sur l évolution cognitive de l utilisateur. On constate que l usage qui est fait de l information trouvée reste le point aveugle ; cette constatation nous oriente vers la proposition d un système d investigation de bases web compatibles où la prise de décision revient à l utilisateur qui évolue dans un système de recherche d information collaborative De l utilisateur à l acteur Le paradigme de la recherche d information s est élargi pour inclure les utilisateurs et leur interaction avec le système [POLITY, 2001]. le paradigme cognitif orienté-utilisateur. En effet jusqu à présent l analyse du besoin d information étudiée n a pas produit des modèles convaincants et l usage qui est fait de l information trouvée reste le point aveugle. A la notion d usagers s ajoute la notion d usage. 123

126 Partie I - Chapitre 3 Les acteurs le paradigme orienté-acteur. L information est vue comme un processus d interprétation et d appropriation cognitive propre à un individu ou un groupe donné. L information dans un processus d intelligence économique [OUBRICH, 2003] est transformable en connaissance par l intermédiaire des acteurs et des processus organisationnels. Les acteurs présentent les agents du savoir, dont leurs missions consistent à créer des nouvelles connaissances. Une information n est transformée en connaissance que si les acteurs possèdent les connaissances appropriées à son traitement ou encore à sa mise en valeur. Ces connaissances sont nommées les «savoir-qui» [GUILHON et LEVET, 2003] ; les «savoir-qui» sont possédés par les acteurs chargés du processus global d intelligence économique, ou par les médiateurs dont les postes se situent à l interface des autres métiers, et qui ont pour mission de faire émerger l information et de la diffuser pour la transformer en connaissance [GUILHON, 2003]. Par les processus organisationnels qui gouvernent l intelligence économique, nous faisons allusion au Knowledge Management et à l Apprentissage Organisationnel. Le Knowledge Management ou Gestion des Connaissances est centré sur l idée de la connaissance, alors que celui de l Apprentissage organisationnel renvoie aux divers processus de transformation de l information en connaissance stratégique. Cette dimension processus fait référence à la création d un contexte qui facilite l expression des principaux processus d Apprentissage Organisationnel et du Knowledge Management. Le Knowledge Management signifie gestion du savoir, des connaissances. Le capital intellectuel des organisations est reconsidéré et placé au centre de la création de valeur. Pour l organisation, il s agit de gérer un capital immatériel, en l occurrence la connaissance, grâce à des outils et à un mode de management. Cette démarche s effectue au moyen de méthodes et d outils, consistant à recueillir, capitaliser, exploiter et diffuser la connaissance. Son objectif est d apporter à la structure qui l utilise, une valeur ajoutée par la pérennisation de ses «savoir» et «savoir-faire». A terme, la Gestion des Connaissances vise à augmenter la performance de l organisation en partageant, créant et en redistribuant les connaissances d une institution pour en améliorer la gestion. Les «connaissances» au sens où nous l entendons deviennent alors synonymes d «information contextualisée». L apprentissage organisationnel comporte une notion de transversalité dans le management stratégique. L apprentissage organisationnel n est pas la somme des apprentissages individuels, c est l institution dans son ensemble qui doit apprendre à s adapter. [ARGYRIS 124

127 Partie I - Chapitre 3 Les acteurs et SCHON, 1978] décrivent l apprentissage organisationnel comme le processus qui implique la détection et la correction d une erreur. Lorsque l erreur est détectée et corrigée, elle permet à l organisation de poursuivre ses politiques, d accomplir ses objectifs. Ce processus de détection et de correction d erreur est un apprentissage en double boucle. L apprentissage en double boucle implique la modification des normes, des politiques, et des objectifs fondamentaux d une organisation. L apprentissage organisationnel résulte d interactions individuelles qui aboutissent à une compréhension commune des choses. En conclusion l usager d un système d information dans une structure partagée devient acteur. En ajoutant de la valeur aux informations, il participe au principe de la gestion des connaissances. Nous voyons là tout l intérêt à structurer le contenu des informations électroniques pour améliorer d une part un meilleur taux de pertinence des informations trouvées et d autre part améliorer la visibilité des auteurs devenus acteurs du système d information dans un contexte qui tient compte à la fois de la gestion des connaissances et de l apprentissage organisationnel. Pour conclure sur cette première partie par l état de l art nous avons pu dégager notre domaine conceptuel c est-à-dire l intelligence économique, notre domaine d application qui est l université, nos objets de recherche qui sont la modélisation des acteurs dans un système d information. En seconde partie nous aborderons un aspect «conception» par l apport de l intelligence économique pour faire évoluer un système d information en un système d information stratégique avec la prise en compte du contexte universitaire Résumé de la première partie L état de l art aborde différents domaines : entreprises, intelligence économique, concurrents, services, gestion, systèmes d'information, entrepôt de données, modélisation, environnement, acteurs, organisations, documentation, exploitation, applications. Cette première partie dessine les contours de l'intelligence économique, son fondement et son évolution. Nous montrons que l'intelligence économique est un concept, concept enseigné en tant que discipline. L'analyse d'articles de presses, d'ouvrages et d'internet met en relief l'imbrication de différentes disciplines scientifiques. On situe la naissance de l'intelligence économique vers les années soixante par l'analyse des textes de H. Wilensky. 125

128 Partie I - Chapitre 3 Les acteurs Le rapport Martre énonce les grands principes et trace les politiques à mettre en oeuvre. Le rapport Carayon propose des axes de travail et aboutit à la nomination d'un représentant de l'intelligence économique au sein de l'etat : Alain Juillet. L'équipe SITE-LORIA a identifié huit étapes dans le processus d intelligence économique ce qui permet de situer nos travaux de recherche par rapport à notre équipe. Une fouille de données opérée dans une analyse de listes de diffusion, puis une analyse bibliométrique à partir de données récupérées dans des bases de données met en évidence des dates clés ainsi que l apparition de nouveaux vocables dans un contexte IE. A partir de 1995, on remarque une mutation du concept «documentation» et «information» vers le concept «technologie de l'information», puis plus récemment l évolution du terme «bases de données» vers le terme «bases de connaissances». Pour une institution publique, il en va de même que pour une institution privée au niveau de l'anticipation des besoins des utilisateurs pour éviter les risques à prendre les mauvaises décisions ou à ne pas prendre de décision. Un des points centraux de l'organisation est son système d'information. L'idée avancée par l'équipe SITE est que les systèmes d'informations stratégiques sont des systèmes d'information particuliers. Cependant la conception de systèmes d'informations stratégiques nécessite une démarche de conception particulière et une modélisation complexe. Là où un catalogue collectif comme le catalogue SUDOC vise avant tout à signaler et à localiser tous types de ressources, le portail SUDOC donne la priorité aux ressources en ligne. L'OAI, Open Archive Initiative associée aux métas données de la Dublin Core facilite l'accès et l'échange de documents. Après avoir rappelé qu'un ENT est un dispositif qui permet à tous les usagers de disposer des services en rapport avec leur activité à partir d'un point unique, sa conception implique une réflexion globale sur l'organisation en tenant compte des acteurs et des objectifs. Il faut aller chercher les bases là où elles sont, en respectant l'interopérabilité des données. Les bibliothèques numériques sont construites en tenant compte de l'interopérabilité des données d'où une problématique technique autour de DC-LOM, Dublin Core Education, métas données descriptives, métas données de structure. 126

129 Partie I - Chapitre 3 Les acteurs Par la dissociation, nous avons déjà pu mettre en évidence un raisonnement par niveaux (étudiants, enseignants et administratifs). De la même façon, nous allons nous attacher au comportement de ces acteurs par rapport aux fonctionnalités du système d'information. Cette typologie favorise l'adoption d'une méthodologie de recherche que l'on a mise en évidence et qui repose sur la méthode des 4P que nous caractérisons par les systèmes Pull, Push, Prospective et Peer to Peer. La modélisation de l'utilisateur est la façon de représenter un utilisateur et ses comportements. Cela concerne également la façon d'exploiter les connaissances dont nous disposons à son sujet. Par exemple, lorsqu un utilisateur visualise un document, il est intéressant qu il puisse indiquer son opinion sur le degré de pertinence du document par rapport à sa requête. La représentation des paramètres cognitifs sur les utilisateurs, par exemple les paramètres nécessaires pour connaître le niveau de connaissance d'un utilisateur pour une meilleure interprétation de sa requête, nécessite la sauvegarde du modèle de l'utilisateur. Par les processus organisationnels qui gouvernent l'intelligence économique, nous faisons allusion au Knowledge Management et à l'apprentissage Organisationnel. Le Knowledge Management ou Gestion des Connaissances est centré sur l'idée de la connaissance, alors que celui de l'apprentissage organisationnel renvoie aux divers processus de transformation de l'information en connaissance stratégique. Au terme de ce résumé de la partie 1 sur l état de l art, abordons à présent la seconde partie sur la modélisation de l acteur d un SIS universitaire. 127

130 128

131 Partie II : Modélisation de l acteur d un SIS universitaire L éducation est au centre de toutes les stratégies de construction de l avenir. C est un enjeu mondial, un des grands défis du troisième millénaire. [Joël de Rosnay] 129

132 130

133 Cette seconde partie intitulée Modélisation de l acteur d un Système d Information Stratégique universitaire restitue notre contribution pour répondre à la question posée au niveau de notre problématique, c est-à-dire : comment intégrer la représentation des utilisateurs dans un système d information stratégique universitaire? Pour mener à bien notre contribution, nous nous appuyons sur l état de l art et nous empruntons une démarche scientifique. Tout d abord nous définissons des concepts : L université est notre domaine d application : ses composants constituent des concepts de base. La modélisation des ressources documentaires et la modélisation des utilisateurs sont nos objets de recherche. Ils constituent des concepts manipulés. De façon pragmatique «théorie», «méthode» et «modélisation» nous permettent de caractériser nos objets de recherche. Par la «théorie», nous voulons démontrer l hypothèse de notre problématique. Nous pensons que si nous prenons en compte un certain nombre d éléments propres à l utilisateur en amont de l urbanisation d un SI, nous travaillons à une meilleure satisfaction de l usager. La «méthode» correspond à une phase plus pragmatique qui nous permet de lister, compter, classifier des éléments propres à nos objets de recherche pour en faire émerger des caractéristiques. La «modélisation» s appuie sur les deux phases précédentes pour réduire ou transformer les objets de nos recherches à une taille gérable pour représenter la réalité [DAVID, 1999]. Ces différentes phases exploratoires aboutiront à la proposition en partie III d une solution sous la forme d un modèle. Modèle qui fait l œuvre d une expérimentation afin d évaluer les résultats de nos recherches. Nous utilisons alors l outil entrepôt de données pour effectuer nos analyses. Pour apporter notre contribution à la modélisation de l acteur d un SIS universitaire le chapitre 4 va nous permettre de développer les propos entamés sur les systèmes d information documentaires par une étude sur les normes et les standards pour nous servir de clé d entrée pour alimenter notre réflexion sur un SIS universitaire. Cette démarche nous amène au 131

134 chapitre 5 à montrer la faisabilité d aboutir à un système d intelligence économique par l exploitation du processus d intelligence économique qui révèle la nécessité d intégrer la modélisation de l utilisateur dans la conception du SIS universitaire, la modélisation de l acteur faisant l œuvre du chapitre

135 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires 133

136 134

137 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires Notre étude porte sur la constitution d un pôle de ressources documentaires dans un cadre pédagogique destiné à la formation et à la recherche prenant en compte l utilisateur. Nous avons choisi comme cadre d étude l Université Nancy 2 qui comporte pour l année 2002 environ étudiants inscrits, 600 enseignants-chercheurs et enseignants titulaires et 350 personnels administratifs, techniques, d éducation et d encadrement. Nous sommes dans un environnement de formation où évoluent des acteurs, des systèmes de ressources documentaires, des systèmes de production d information et des systèmes de recherche d information. Les dispositifs des nouvelles technologies éducatives mettent à disposition : des cours, des projets, des ressources documentaires, des données financières, des données administratives, des informations sur les acteurs, des systèmes de partage d information d où se dégagent de nouvelles fonctionnalités. Le recours à des normes et des standards pour la conception d un entrepôt de données de ressources documentaires dans un cadre pédagogique, intégrant la modélisation de l utilisateur assurent l interopérabilité des composants et la réutilisation de ressources. La normalisation n est pas systématiquement synonyme de restrictions ou de contraintes fortes. La norme fournit un cadre dans lequel il est possible de trouver de multiples moyens d expression. Cependant tous les cas de figure ne sont pas exprimables par le recours à une norme, comme les usages faits d une information. La description de ressources en vue de leur réutilisation dans des parcours de formation, évoque les difficultés rencontrées et permet de formuler des propositions pour combler des manques et rendre plus opérationnels certains descriptifs. Normalisation Normalisation Normalisation = = = Restrictions Interopérabilité Réutilisation Ne résout pas tous les cas de figure Figure : Prise en compte du phénomène normalisation pour la modélisation des ressources documentaires L équipe SITE a développé deux modèles propres aux acteurs : MEPD 78 et WISP 79. Parallèlement à ces deux modèles, nous trouvons un panel de normes autour des documents électroniques et de ressources en ligne. Nous évoluons dans un processus d enseignement qui 78 MEPD : Modèle pour l'explicitation d'un problème décisionnel 79 WISP : Watcher-Information-Search-Problem 135

138 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires tend à favoriser la prise d autonomie des étudiants, en proposant des formations individualisées. Si on s attarde sur le processus d apprenant lors du parcours de l étudiant, on s aperçoit que la modélisation du système d information permet de mettre en relation des objets propres à différentes classes. Sachant qu il n existe pas de normes préétablies pour un Entrepôt de Données Documentaires et que l élaboration d un standard est un long processus qui s étale sur plusieurs années, nous analysons les normes existantes. Nous devons identifier les classes des ressources documentaires de notre Entrepôt de Données Documentaires. Une fois ces classes d objets bien définies, nous avons recours aux normes existantes, qu il faut enrichir selon les besoins spécifiques à notre SI SIS. Nous sommes à un stade de réflexion où à la fois il faut décrire les utilisateurs de l Entrepôt de Données et à la fois décrire les ressources d information. Le but étant de favoriser la mise à disposition de l utilisateur final, les ressources d information les plus adaptées. Sachant qu un utilisateur peut avoir plusieurs rôles, il est donc amené à disposer d un environnement pluriel Modélisation des ressources documentaires Par cette section, nous développons la problématique des normes documentaires abordée en section 2.4. intitulée «L existant dans le contexte universitaire». Il s agit de pouvoir énoncer les principales caractéristiques d une ressource selon différentes facettes : technique, pédagogique, utilisation, référencement, droits, relations. Les modèles de description des ressources documentaires ont aujourd hui acquis de fait une certaine stabilité. Il s agit d adapter ces standards pour qu ils rencontrent les besoins spécifiques et concrets des utilisateurs. Cela signifie interpréter, raffiner, étendre et parfois même simplifier les syntaxes et les sémantiques pour s adapter aux exigences fonctionnelles d une application particulière, tout en restant interopérable avec les schémas d origine. Nous disposons de normes de description françaises, européennes et internationales. Ces normes prennent en compte les concepts propres à leurs contours géographiques. Il est donc quasiment impossible de recourir à leurs recommandations et de les calquer à nos critères. Néanmoins, nous évoluons dans un contexte où il y a souci d harmonisation sur un plan européen, cela se concrétise par la mise en place du LMD 80. Dans un contexte mondial, on favorise les échanges internationaux pour les formations, les stages et les emplois. 80 LMD : Licence-Master-Doctorat 136

139 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires Typologie des ressources documentaires On pourra se reporter aux travaux entrepris au cours du DEA dans le chapitre I.1.3 «Typologie de document et son devenir dans le contexte électronique» dont nous restituons quelques éléments. Le but de la recherche d information est d atteindre la documentation primaire (ouvrages, articles de périodiques mémoires, thèses, brevets) sur différents supports via la documentation secondaire par exemple : les catalogues et/ou via la documentation tertiaire par exemple : les bases de données. Le document était auparavant électronique par «accident», traversant cet état au cours d une des multiples manipulations et conversions qui l amenaient jusqu à l utilisateur. Ce format est désormais son format originel, poursuivi d un bout à l autre de la chaîne documentaire, de la production par traitement de texte à la consultation sur écran. C est la définition même du document qui est remis en cause : initialement perçu comme un ensemble organisé d informations, il est à présent démembré en éléments que le langage informatique qualifie justement de «données». Le terme même de document est en passe d être dépassé par le développement des systèmes hypertextes ou de recherche par arborescence de structures qui extraient l information indépendamment de son origine (d où une perte substantielle d informations délivrées par le contexte). Le phénomène s est accentué avec l apparition des «hyperdocuments», constitués d informations de toute nature et de toute origine, qui amènent à considérer la fédération de serveurs Internet comme un seul document. Si l électronique enlève au document sa cohérence interne, elle le fait enfin accéder à une mobilité essentielle pour circuler dans un système documentaire. Libéré du statisme de l imprimé, converti en de multiples formats favorisant sa diffusion, puis en un quelconque paquet de bits en transit sur un réseau, il s intègre désormais à un mouvement d échange. Il appartient aux bibliothèques de conjuguer cette circulation du document électronique avec la chaîne documentaire, sachant que leur objet n est plus le traitement du document, mais bien celui de l information qui en représente un état provisoire. Qu est ce qu un document par rapport au contenu? Les documents peuvent s inscrire sur différents supports qui stockent des instructions pour construire du sens. papier : livres, périodiques, encyclopédies, thèses..., magnétique : cassettes audio ou vidéo, photographique : microfilms ou microfiches, 137

140 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires numérique : disquettes, disques durs, cd-roms, sites web. L ISO 9000:2000 définit le document comme «l ensemble d un support d information et des données enregistrées sur celui-ci sous une forme en général permanente et lisible par l homme ou par une machine». C est cette dernière alternative qu on retiendra pour définir le document électronique comme un ensemble d informations numériques. Aujourd hui, on peut dire qu un document est un assemblage d objets documentaires liés tant au niveau de la forme que du sens. La numérisation permet d intégrer tous ces objets (texte, son, dessin) sous un format unique, et sur un support indépendant de la nature de l information, intégration qui lui permet de circuler dans tous les canaux numériques et d être disponible sans contrainte géographique. Ces quelques traits suffisent déjà à les distinguer de leurs «ancêtres» papier. Mode de représentation d un document On peut représenter un document par : sa perception (auditif, olfactif, tactile, visuel), le processus cognitif de lecture (linéaire comme le livre ; non linéaire comme l encyclopédie, l hypertexte), par le codage (analogique comme le film ; numérique comme le cd-rom), par l aspect représentatif (élément informationnel linguistique comme le texte ; iconique, comme l image) On peut avancer qu aujourd hui tout document existe à un moment ou un autre sous forme numérique à un stade de sa production. Cette affirmation est d importance si l on ajoute que ce document devrait recouvrir cette même forme à un stade quelconque de sa diffusion : le support papier devient une étape inutile de la vie d un document. On a vu quelques produits, initialement compléments de l imprimé, se substituer totalement à leur parent, essentiellement des banques de données ou des répertoires, qui bénéficient d une grande rapidité de mise à jour. Bibliothèques numériques Outre le fait que les bibliothèques offrent leur catalogue via Internet, elles offrent de nombreux services directement chez l utilisateur. Ainsi le chercheur peut consulter directement depuis son laboratoire ou son domicile des bases de données, des journaux électroniques et des livres électroniques. Les bibliothèques qui ont adopté la norme ISO Z39.50 permettent via des logiciels spécifiques (EndNote) l interrogation simultanée de plusieurs catalogues et la récupération de notices en grand nombre. On peut regretter qu il n y 138

141 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires ait pas de domaine réservé pour les bibliothèques, ce qui faciliterait l interrogation à partir de l Url. Le SI de l université propose différents types de documents à destination de types d acteurs différents qui font l objet de recherche au chapitre 2 de la partie II. On recense entre autres: des documents administratifs, des cours, des plaquettes, des images, des vidéos, du son, des catalogues de bibliothèque, des bases de données, des livres électroniques, des journaux électroniques. Tous ces éléments sont au service des conceptions de formation, pour les enseignants et les étudiants en situation de recherche ou de création d information. L étape de modélisation de classes d objets permet de faire apparaître des attributs et des valeurs selon le schéma suivant : Nom de la classe Attribut1: type=valeur initiale Attribut2: type=valeur initiale Figure : Formalisme de représentation Administratifs Actualités Vie institutionnelle Enseignement et vie universitaire Documents de politique générale de Nancy 2 Vie du personnel Informations financières La recherche et sa valorisation Informatique Hygiène et sécurité Relations internationales Prestation de services Documentation administrative Univers documentaire Catalogues de bibliothèque Notices catalographiques Document électronique primaire Localisation Bases de données Notices catalographiques Résumés Document électronique primaire Localisation Figure : Modélisation du type des documents L objectif de la modélisation, puis de la description est de favoriser la visibilité d un patrimoine pédagogique tout en préservant une expression simple des informations pouvant répondre aux questions suivantes : Quelles sont les caractéristiques de la ressource? Comment est gérée la propriété intellectuelle? Comment classer cette ressource? Comment mettre en relation le profil de la ressource et le profil utilisateur? 139

142 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires Description Document Description Utilisateur Figure : Filtrage d information pour les ressources documentaires par mise en correspondance du profil document et du profil utilisateur Description des ressources documentaires 1 er cas de figure : Ces types de documents sont gérés par des systèmes qui leur sont propres, accessibles au travers de leur propre moteur de recherche ou par des moteurs de recherche fédérés. En ce qui concerne les catalogues de bibliothèque, les bases de données, les livres électroniques, les journaux électroniques, le format utilisé pour la description des notices tend vers le format MARC, avec des sous-parents : LC-MARC, UNIMARC, US-MARC. En ce qui concerne la classification et l indexation, on s aperçoit qu il est impossible d avoir recours à un système unique. Quant à l indexation, on voit les limites du recours à un thésaurus unique. Ces systèmes de classification et d indexation ne suffisent pas à tous les impératifs de description pour les ressources documentaires. Mise en relation Catalogues de bibliothèque Bases de données Livres électroniques Journaux électroniques MARC LC-MARC UNIMARC US-MARC + + Format la classification = Connaissances l indexation = Disciplines Figure : Limites du système classique de description 2 ème cas de figure : Les documents sont déposés sur le SI sans classification, sans indexation, sans aucune information sur leur contenu, leur contenant, leur but, leur impératif technique. Les pratiques mettent en évidence que peu d utilisateurs remplissent les propriétés du document qu ils conçoivent et déposent sur un SI. D où la difficulté de récupérer des zones vides. Plusieurs scénarios s offrent pour palier ces lacunes. Le processus de description des propriétés d un document est une étape contraignante pour un auteur et suppose une culture de la description de documents. Le processus peut se faire de différentes manières : 140

143 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires remplir un formulaire, récupération du profil utilisateur : identification, domaine, données sur le document (taille, format ), une combinaison de ces deux éléments : un formulaire pré rempli par récupération du profil utilisateur et de données sur le document à compléter ou à modifier en proposant en arrière fond des listes contrôlées Emetteur Propriétés + Indexation plein texte + Catalogage, classification, mots-clés Récepteur Figure : Limites des descriptions des ressources documentaires Fort de ces préambules, il s agit bien pour nous de faire rencontrer utilisateur et documentation. Corréler acteurs et ressources passent par l analyse des normes et standards en vigueur dans les universités. On peut distinguer les normes propres aux documents de tous types et les normes propres aux documents pédagogiques. Documents de tous types : Limites Ce souci d indexation de documents électroniques a pris toute son ampleur avec l indexation des pages web par les moteurs de recherche. La Dublin Core, la RDF 81 ou XMP 82 sont des réponses pour ajouter des métas données 83, prises en compte lors de l indexation et sensée améliorer les réponses du système par rapport aux mots-clés de la question posée. Les normes IPTC 84, EXIF 85, DIG35 86, JPEG 87 ont été plus particulièrement développées pour les images. 81 RDF : Resources Description Framework 82 XMP : Extensible Metadata Platform 83 Méta données : Une métadonnée est une «donnée sur des données» 84 IPTC : International Press Telecommunications Council 85 EXIF : EXchangeable Image File 86 DIG : Digital Imaging Group 141

144 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires MPEG-7 88 concerne la description des objets multimédia. RKMS 89 aide à décrire les ressources audio. PRISM 90, NewsML 91, NITF 92 concernent la presse. Les ressources décrites sont très variées : monographies, publications en série, articles, archives, pièces de musée, images, séquences audio ou vidéo, des textes, graphiques, photos, séquences audio, vidéo et animations. Ressources pédagogiques : Les normes LOM 93, EML 94 et Scorm 95 apportent de nombreux éléments de réponses sur plusieurs points : le domaine, le matériel, l interopérabilité des plates-formes, le type de médias, l interface homme machine, la description des contenus, l architecture du système, les technologies collaboratives, le vocabulaire, les informations sur le participant, la description des compétences, la propriété intellectuelle, la qualité. Nous voyons qu au même titre que nos acteurs, ces domaines constituent des classes d objet Les Métas informations et leur mise en application par les métas données Les métas informations autour d un texte permettent d ajouter de la valeur à un système d information. L acteur est à la fois demandeur et consommateur, car il est placé dans différents contextes puisqu il peut avoir plusieurs rôles : demandeur ou producteur d informations. Les degrés d exigence de l utilisateur varient en fonction des informations. Nos recherches ont clairement mis en évidence qu un étudiant n a pas les mêmes besoins qu un expert dans sa quête de l information. Par exemple, dans la plateforme Moodel, il faut distinguer les cours selon leur support. Une présentation PowerPoint qui a une durée de vie limitée ne nécessite par forcément le même formalisme de description qu un cours magistral. Du coup en fonction de son rôle lors d un scénario de recherche d information l utilisateur n attend pas la même «réponse idéale du système» selon l objectif de sa recherche. A titre d exemple un responsable d UFR enseignant l informatique n aura pas la même approche au niveau de la recherche s il veut préparer un cours ou améliorer les conditions de 87 JPEG : Join Photographic Experts Group 88 MPEG : Moving Pictures and associated audio information coding Experts Group 89 RKMS : Recordkeeping Metadata Schema 90 PRISM : Publishing Requirements for Industry Standard Metadata 91 NewsML : News Markup Language 92 NITF : News Industry Text Format 93 LOM : Learning Object Metadata 94 EML : Educational Modelling Languages 95 Scorm : Sharable Content Object Reference Metadata 142

145 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires travail de son personnel : S agit-il pour lui de s informer par rapport à l offre commerciale dans l objectif de renouveler l équipement du personnel? S agit-il de préparer un enseignement détaillé intégrant l offre actuelle du marché, mais aussi un certain nombre de caractéristiques globales communes aux différents produits, et des critères de choix? S agit-il de faire une synthèse sur les évolutions historiques de la technologie? S agit-il d acquérir quelques notions de base? S agit-il de se documenter sur les évolutions les plus récentes et les plus significatives? S agit-il de réfléchir à l impact social d une nouvelle technologie? En fonction de ces différents facteurs l attente de l utilisateur varie. S il est difficile d imaginer quels besoins peut conduire tel acteur à récupérer de l information lorsqu il est dans une recherche via le web par exemple, il est plus facile par contre dans un contexte comme l ENT d imaginer ses attentes pour l orienter selon les cas, vers des documents simplement analytiques, signalétiques, synthétiques ou au contraire vers des documents spécialisés. En d autres mots, une connaissance de l acteur permet de corréler ses objectifs dans son environnement de travail. Dans cette perspective, une recherche d informations ne peut se contenter d être décrite par son sujet, qui concerne le thème abordé dans les documents et qui a longtemps été exprimée par les descripteurs. Une recherche d information doit également permettre de décrire un certain nombre de facteurs relatifs au mode de discours. De quelle façon le texte traite-t-il du sujet? Sous quel angle, en privilégiant quel aspect, en s adressant à quel type d acteur, dans quelle perspective, avec quel mode d expression? Or certaines attentes simples étaient déjà impossibles à décrire dans les SRI traditionnels où les notices bibliographiques étaient pourtant déjà très riches en «information sur l information». Elles sont encore plus difficiles à exprimer dans le contexte actuel de documents numériques directement mis à disposition de la communauté par leur auteur, sans étape intermédiaire d intégration dans une collection. Lorsque nous parlons d attentes relatives à des caractéristiques liées au mode de discours comme par exemple de quelle façon le texte aborde-t-il le sujet qu il traite?, nous évoquons en fait des métas informations de deux types. 143

146 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires Métas informations simples Certaines d entre elles sont objectives et factuelles. Il s agit d informations que l on aimerait voir renseignées, et dont l instanciation par des experts serait relativement aisée et probablement consensuelle. Nous pouvons mettre dans cette catégorie de multiples données relatives au contexte de production, nous inspirant de l analyse de Bronckart [BRONCKART, 1985], ancien collaborateur de Jean Piaget, qui considère qu un texte peut être décrit par sa finalité, l enjeu social dans lequel il s inscrit, son contenu thématique, les processus cognitifs qu il mobilise et son support. Par exemple, dans le cas des documents scientifiques, il est relativement aisé de différencier un article d un mémoire ou d un support de cours, ou un article primaire. Quelqu un qui connaît le domaine peut différencier une publication à comité de lecture d une autre qui ne l est pas. Par l analyse d informations fournies dans le corps du document, ou par le site qui héberge le document, il pourra identifier la communauté dont fait partie l auteur, son domaine de compétence ou sa spécialité disciplinaire. La démarche adoptée sera alors sensiblement de la même nature que celle qui préside habituellement à l élaboration de langages documentaires contrôlés : il faudra normaliser un ensemble de valeurs possibles pour des informations telles que «type de revue», «type d article ou de texte», «domaine de l auteur» et dans un deuxième temps il faudra décrire les documents par les valeurs adéquates. Si l élaboration d un langage de représentation contrôlé relève d une responsabilité humaine, le choix des valeurs significatives pour un texte donné pourra sans doute dans certains cas être assisté par la mise en oeuvre de procédures automatiques d instanciation, par le repérage d indices textuels ou structurels dans le texte ou son environnement immédiat Métas informations prenant en compte des jugements de valeur Les jugements de valeur dont nous parlons ici ne sont pas des jugements au sens absolu (du type «ce document est bon»ou «ce document n est pas bon») mais sont des jugements de valeur relatifs à certains types d attentes. Par exemple, sur une grille évaluant le degré d accessibilité à un profane, des valeurs maximales correspondraient à des documents utilisables par un public n ayant qu un minimum de connaissances préalables sur le sujet, alors que des valeurs minimales correspondraient à des documents qui ne pourraient être utiles qu à des lecteurs très avertis et spécialistes du même domaine que l auteur du document. Une telle caractérisation pourrait être largement développée ou affinée selon les 144

147 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires attentes spécifiques de différents publics. A titre d exemple, nous pourrions envisager une évaluation sur des critères tels que : Valeur institutionnelle : valeur institutionnelle ou officielle de producteur (liée à la communauté d appartenance de l auteur), valeur institutionnelle du support éditorial (liée à la revue ou la collection), Valeur d accessibilité : accessibilité à un public plus ou moins expert du domaine, Valeur de précision : précision des données (vocabulaire ou représentation, précision des mesures), information sur les données (conditions de collecte, outils d analyse), Valeur d intermédiation : nombre de niveaux entre le document et l information originelle, Valeur de synthèse : mise en relation ou en contexte, interdisciplinarité, Valeur d originalité : aspect novateur ou atypique, Valeur de subjectivité : opinions, jugements, expression du point de vue de l auteur, Valeur d impact : facteur d impact (citations), couverture dans les bases de données, exploitation (informations sur les fréquences de consultation, prêt, demandes de photocopies) Les métas données Nous allons voir comment tirer parti des métas informations par le recours aux métas données sur un plan informatique. Les métas données constituent un des éléments qui ont permis la structuration des bibliothèques numériques, comme l explique un article de François Role [ROLE, 2004]. Comme nous l avons vu, l expansion rapide des réseaux et les progrès techniques numériques rendent accessible un nombre croissant de ressources électroniques. D où l idée de structurer le contenu et de lui associer une description. Actuellement, la structuration du contenu passe de plus en plus par l utilisation de langage de balisage logique reposant sur XML. L association d une description au contenu revient, elle, à créer des «métas données» (metadata en anglais) relatives à ce contenu pour en faciliter la gestion et l exploitation. Cette notion de métas données est très souvent évoquée dans des publications issues de différentes communautés (bibliothèques numériques, bases de données multimédias, web, data warehouse). Les métas données dépendantes du contenu (content-dependent metadata), ce sont celles qui peuvent être dérivées directement de ce dernier. Par exemple 145

148 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires dans le domaine des documents textuels, il peut s agir d index en texte intégral. Les métas données qui sont fondées sur le contenu des données, mais qui peuvent être dérivées directement, sont considérées comme indépendantes du contenu. Par exemple, la date de dernière modification d un fichier est une méta donnée indépendante du contenu de ce fichier. L idée générale qui se dégage de la notion de méta donnée est celle de données relatives à d autres données, et destinées à supporter des traitements impliquant ces autres données. On ne peut espérer trouver ce qu on cherche dans une bibliothèque informatisée en n utilisant que des critères de recherche à base de mots du texte : il faut absolument effectuer des recherches qui tiennent compte du contexte. Le contexte se décrit d abord à l aide de la notion de structure du document, qui distingue le titre de l ouvrage et son résumé, les divers chapitres, le titre et les paragraphes d un chapitre, le titre d un paragraphe, les figures et leur titre, etc. Le contexte se décrit ensuite avec les concepts d un vocabulaire standard. Les mots de ce vocabulaire ont des définitions connues et précises, et leur liste est courte : quelques centaines de mots en général. Le vocabulaire lui-même caractérise un domaine de connaissances. Nous trouvons des outils qui permettent d extraire les métas données de ressources électroniques. Nous pouvons citer par exemple un site canadien qui tient à jour quelques liens sur des éditeurs de métas données de ressources pédagogiques comme ADLib, ALOHA 2, LOMPad, PALOMA, Reload v2.0 et SHAME. Ces éditeurs sont opérationnels via des interfaces web. Figure : Méta référenceur Paloma 146

149 Partie II - Chapitre 4 Prise en compte des normes et standards pour modéliser les ressources documentaires Nous avons également testé un logiciel sous Windows MetaDataMiner Catalogue PRO. Ce logiciel explore et capture les métas données des documents et propose des exports sur le schéma Dublin Core. Figure : Récupérateur de métas données Catalogue 7.10 Nous pouvons conclure à une forte activité de la part des professionnelles de l information pour redéfinir les formats de description des ressources documentaires électroniques. Ce mouvement est conditionné à la fois par les modes d accès à l information via des browsers mais également à un souci de pertinence des réponses. Cette démarche est renforcée par la présence du moteur de recherche Google. Cette situation implique une démarche de repositionnement des professionnels de l information. Une remarque anime pratiquement tous les débats lors des plans de formation autour de la recherche documentaire : comment amener les étudiants à découvrir d autres outils de recherche que Google quand Google est en mesure de les satisfaire rapidement. Un proverbe dit : pour faire face à un gorille il faut danser avec lui jusqu à ce qu il s épuise! Avant d aborder dans le chapitre suivant le processus de l intelligence économique pour intégrer la modélisation de l acteur dans un contexte universitaire, nous pourrons retenir l importance des formats de description des ressources électroniques dans un cadre de modèles alternatifs décrits en Ces modèles aussi appelés modèles palliatifs sont apparus à une période de crise dans les services de documentation compte tenu de l augmentation du coût de la documentation électronique. Contexte économique et nouvelles technologies ont permis de se distancier du «modèle catalogue» pour l émergence d idées autour de «système d information communicationnel» où nous glissons d une science «faite» à une science en train de «se faire» et de «se dire». 147

150 148

151 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire 149

152 150

153 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire Ce chapitre nous permet de montrer que le système d information de l université est complexe et hétérogène car il repose sur une juxtaposition d applications. Nous allons montrer comment nos idées pour modéliser les acteurs de l université en nous appuyant sur le processus de l intelligence économique permettent de créer de la valeur au sein de l université. Les technologies permettent de repenser les systèmes organisationnels où les acteurs passent du rôle de «consommateur» d information au rôle de «passeur» d information. Enjeux Les étudiants ont pour but de réussir, apprendre mieux, autrement, efficacement par la construction d un projet professionnel qui doit les aider à trouver un emploi. Il est possible de les aider en améliorant l offre de recherche. Les enseignants sont amenés à produire et diffuser des informations. On peut contribuer à améliorer leur visibilité. Les décideurs doivent anticiper les événements pour mener une politique globale. On peut aider le processus décisionnel par l élaboration d indicateurs Système d information de l université Dans une université cohabitent de nombreux Systèmes d Information (SI) spécifiques aux besoins des institutions. Ces systèmes épars abritent des informations qui peuvent être utiles aux composantes voisines. On se pose la question à savoir : comment participer à l amélioration du système d information? On assiste à des efforts de rationalisation pour permettre des passerelles entre ces différents systèmes d information afin de mutualiser des fonds d information. Toutefois ces passerelles pour la plupart n existent uniquement que dans un sens. Les SGBD développent des passerelles afin d importer dans leurs systèmes locaux les données des logiciels de l administration centrale. Il ne semble pas encore être possible, pour les institutions mettant à jour leurs systèmes locaux via leur propre système d information de mettre à jour en temps réel les données de l administration centrale. Ces institutions effectuent une ressaisie. A la lecture de différents cahiers des charges élaborés lors de l informatisation ou réinformatisation de leurs services, on constate bien que les institutions tiennent compte de l existant de l administration centrale dans le but d une récupération, toutefois l inverse (alimentation via une passerelle des logiciels de l administration centrale) est rarement émis. 151

154 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire L existant Dès 2002, nous avons entrepris d analyser «l Existant» que nous avons exposé lors de notre contribution à VSST 2004, [PEGUIRON et THIERY, 2004]. Quatre éléments importants ressortent et constituent le cadre de base pour élaborer une stratégie : Agence de mutualisation des universités - AMUE 96 Sur un plan national, plusieurs consortiums d universités se sont constitués pour proposer des espaces numériques de travail (EPPUN 97, Esup 98 ). Ces consortiums tiennent comptent des recommandations de l AMUE [AMUE, 2002] pour la constitution d un Système d Information sous forme de briques. On peut trouver au sein de ces briques notamment des environnements de formation à distance comme MOODLE [MOODLE, 2005], ARIADNE [ARIADNE], Dokeos [DOKEOS], ainsi que des portails documentaires. L agence de mutualisation des universités [AMUE, 2003] mène une étude pour produire des cahiers des charges autour de ses futurs produits pour l année 2006, plus spécifiquement autour de la Scolarité et de la Gestion en vue de l élaboration fonctionnelle, organisationnelle et technique du Système d Information ou Système d information de Gestion d un établissement. L entrepôt de données Au sein de l agence de mutualisation des universités une équipe sous la conduite de Sibylle Rochas, élabore un entrepôt de données à partir de bases de données de gestion des services de la scolarité APOGEE 99, des ressources humaines HARPEGE 100 et de la gestion financière NABUCO 101 afin d aider au pilotage des universités. Des projets [DESNOS, 2002] et [NATAF, 2001] aboutissent à la mise à disposition d un extracteur de données et d un méta dictionnaire pour les sites pilotes. L audit Le cabinet de consultant Cap Gemini Ernst et Young [CAP, 2003] mène un audit sur les Etudes préalables à l élaboration d un Système d Information et de Gestion afin d optimiser les performances d un établissement universitaire. Nous retrouvons dans la Tranche 1 de cette étude les concepts propres à l entrepôt de données qui doivent nous guider dans l élaboration 96 AMUE : Agence de mutualisation des universités 97 EPPUN : Espaces pédagogiques pour les universités numériques 98 Esup : Environnement numérique de travail d accès intégré aux services pour les étudiants et le personnel de l enseignement supérieur 99 APOGEE : Gestion de la scolarité 100 HARPEGE : Gestion des ressources humaines 101 NABUCO : Gestion financière et comptable 152

155 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire de notre démarche qui sont entre autres : paramétrer le système de pilotage, définir les objectifs, ajuster les tableaux de bord, alerter. Esup Esup portail [ESUP] est la constitution d un consortium d universités auquel adhèrent d ores et déjà : l Université de Valenciennes, l Université Nancy 2 [BOYER et NOMINE, 2001], l Université Henri Poincaré Nancy 1 [Antoine et AVELIN et BOURGES, 2003], l Université de Rennes 1, l Université Paul Sabatier Toulouse 3 bientôt enrichi d autres universités : Université du Littoral, Université de Versailles, INPL, INPT, Université du Havre, Université Antonine (AUF), Université Rennes 2, IUFM de Bretagne, Université de Franche-Comté, Centre Universitaire de Formation et Recherche Jean-François Champollion (ALBI). Rappelons qu un espace numérique de travail (ENT), dans notre cas Esup, désigne un dispositif global fournissant à un usager un point d accès à travers les réseaux à l ensemble des ressources et des services numériques en rapport avec son activité. Il est un point d entrée pour accéder au système d information de l établissement. L établissement d enseignement est le périmètre de référence de l espace numérique de travail du point de vue de l utilisateur. L espace numérique de travail s adresse ainsi à l ensemble des usagers, étudiants, enseignants, personnels administratifs et techniques. Cela ne signifie pas que les services et ressources sont exclusivement fournis par l établissement : l espace numérique de travail doit au contraire favoriser leur mutualisation, au niveau inter établissements, avec les partenaires publics et privés, en France, en Europe ou au niveau international. Esup portail contient les briques assurant l accès aux applications métiers mises en place dans les universités (comptabilité, scolarité, gestion des ressources humaines, enseignement à distance, gestion documentaire, vie de l université). Il s appuie sur le système d information de l établissement qui doit être conçu en cohérence avec les applications de gestion propres à l établissement. Esup Portail retenu par l Université Nancy 2, comme l explique Brigitte Nominé [NOMINE, 2004] implique d avoir un système d information complet, cohérent et structuré. Cela suppose une base d utilisateurs avec droits associés, ainsi que la définition de profils types et de leur environnement standard. Le schéma ci-dessous met bien en relief l architecture technique sous forme de briques d Esup portail qui repose sur uportal. 153

156 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire Figure : Architecture technique d Esup portail sous forme de briques uportal est un projet de portail libre développé pour les institutions de l éducation supérieur. Un portail est par définition une agrégation de contenus et de services. Concrètement, uportal est divisé en onglets, eux même subdivisés en canaux. Chaque canal étant porteur d un service ou d un contenu, facilement transférable d un uportal à un autre. Il existe beaucoup de canaux libres de droits, développés par la communauté d utilisateurs d uportal dans le monde. Notamment la communauté universitaire française : ESUP. Cette fabrication offre la possibilité de pouvoir s intégrer à l existant via une n ème brique au Système d Information. Voyons comment exploiter le processus d intelligence économique dans l élaboration du système d information de l université Exploitation du Processus Intelligence Economique Si on observe la mise en place du système d information globale de l Université Nancy 2, on remarque qu il repose sur la juxtaposition de services au sein de l espace numérique de travail. Détaillons les briques d Esup pour lesquelles on y retrouve le logiciel qui en gouverne la gestion informatique de chacune d entre elles : Brique administrative : NABUCO, Brique scolarité : APOGEE, Brique ressources humaines : HARPEGE, 154

157 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire Brique de dépôt de cours : MOODLE 102, Brique documentation : HORIZON 103, Brique vie de l université. On constate que toutes les données issues de ces différents systèmes d information peuvent participer à l alimentation d un infocentre 104. Cependant un infocentre est une vision centralisée des données qui ne concernent que les données de production donc peu ou pas historisée. En revanche l alimentation d un infocentre ne nécessite pas la construction d un nouveau système. Brique administrative : nabuco Brique scolarité : apogee Brique ressources humaines : harpège Brique de dépôt de cours : moddle Brique documentation : horizon Brique vie de l université. INFOCENTRE Figure : Système d Information Global de l Université Nancy 2 Si on s attarde sur les briques «administrative», «scolarité» et «ressources humaines» dont les logiciels ont servi à construire à un extracteur de données proposé par l AMUE, on constate que cette solution n a pas été retenue par toutes les universités sur un plan national (dont aucune à NANCY) car les logiciels ont été complétés par des développements locaux. Les structures des tables ont été changées et ne permettent plus d implémenter le produit développé par l AMUE. La plateforme de gestion de cours MOODLE permet de déposer les cours des enseignants. A l heure actuelle, MOODLE est essentiellement un lieu de dépôt. Des projets en cours menés par le Professeur Monique Grandbastien pour l Université Henri Poincaré, ont mis en avant la nécessité à améliorer les descripteurs des cours déposés. Au vue de nos travaux de recherche, Madame Grandbastien s est adressée à notre équipe pour nous associer dans les projets en 102 MOODLE : Gestion de cours 103 HORIZON : Système Intégré de Gestion de Bibliothèque 104 Infocentre : Terme IBM.Ancêtre du DataWarehouse, l'infocentre est une base relationnelle destinée aux travaux d'analyse et d'aide à la décision. 155

158 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire cours. MOODLE témoigne de l évolution du rôle de l acteur enseignant. Producteur de contenu, l enseignant est amené à devoir s attacher au contenant. Sur ce point, nous apporterons des réflexions pour améliorer la visibilité de l auteur. HORIZON est le système intégré de gestion de bibliothèque choisi par le service commun de l Université Nancy 2. Il permet de gérer le contenu de 30 bibliothèques de l université des sciences humaines de Nancy. Il offre un portail d information HIP 105 qui permet la recherche dans les ressources documentaires possédées par les bibliothèques. Les différentes briques du Système d Information Global sont accessibles à partir d une authentification unique reposant sur le Ldap. Si on se tourne vers l Université Henri Poincaré, on retrouve pratiquement la même structure reposant sur les mêmes logiciels. Le dernier choix du même logiciel documentaire HORIZON confirme l orientation des universités vers des outils semblables. Ces choix technologiques préfiguraient la volonté d aboutir à une université unique. Cette notion de transversalité, d abord apparue au sein de chaque université, symbolisée par exemple par la Revue Transversale de l Université Henri Poincaré est devenue une nécessité mise en avant par les décideurs des trois universités nancéiennes pour anticiper d une part la baisse de la natalité 8000 étudiants en moins ces prochaines années et d autre part pour ramener en rang 1 «l Université de Nancy». Nous constatons que nous avons une juxtaposition de systèmes d information qui ne permettent pas de répondre à certaines questions dans un contexte décisionnel car un système opérationnel ne permet pas de répondre aux besoins des utilisateurs. Ces constatations aboutissent à nos propositions pour développer un système d information global vers la décision. Brique administrative : nabuco ENT Brique scolarité : apogee AMUE difficultés Brique ressources humaines : harpège Brique de dépôt de cours : moddle Pauvreté descripteurs Brique documentation : horizon Non intégré Brique vie de l université. Business Processing management Figure : Le processus Intelligence Economique pour l intégration des services 105 HIP : Horizon Portail d Information 156

159 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire C est pourquoi, nos propositions, par le recours au processus d intelligence économique, favorisent un système à l image du Business Processing management dans le but d améliorer le Système d Information Global par le biais de l intégration. Intégration déjà au sein de chacune des universités, avec l idée actuelle et sous-jacente que prochainement, il s agira d intégrer les services des différentes universités pour ne participer qu à un seul système d information global. D ors et déjà, l Université Henri Poincaré a fait évoluer son système d authentification Ldap vers le procédé Shibboleth 106. Dans un environnement Shibboleth, les usagers peuvent être authentifiés comme appartenant à un groupe (enseignants, étudiants de 1icence, master ou doctorat) mais ne pas être autorisés à utiliser telle ou telle ressource. Sa particularité est de modifier complètement la manière d accéder aux ressources en ligne. Traditionnellement les usagers se connectent au système propriétaire des données (site web d un éditeur, portail d une entreprise ou d une institution) où se fait leur authentification. Avec Shibboleth, c est l institution à laquelle appartient l usager qui vérifie qu il est bien inscrit dans son annuaire et transmet au fournisseur de contenu les informations nécessaires à l accès. L échange d informations entre Shibboleth et les services visés se fait dans un environnement web, permettant un accès rapide aux ressources demandées. Rappelons qu il s agit de favoriser les apprentissages, améliorer le service aux usagers, rationaliser l offre de services, valoriser les infrastructures, valoriser les productions, réutiliser les ressources, renforcer l autonomie des étudiants, améliorer la visibilité des auteurs, faciliter la création. Ce préambule constitue un cadre pour notre problématique entre : l intelligence économique, le processus décisionnel et la problématique de l information. Aujourd hui on trouve de nombreux cours en libre accès et des formations diplômantes. Nous sommes dans un environnement de formation où évoluent des acteurs, des systèmes de ressources documentaires, des systèmes de production d information et des systèmes de recherche d information. Nous observons le comportement des utilisateurs en situation de recherche d information, et réfléchissons à la constitution d un pôle de ressources documentaires dans un cadre 106 Shibboleth est un logiciel médiateur «glue» en anglais, c'est-à-dire de couches logicielles intercalées entre le réseau et les applications. Ces programmes servent principalement à authentifier et autoriser les usagers de services en ligne, distinction importante dans ce contexte. Le projet a été lancé en 2000, sa version 1.1 est sortie en

160 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire pédagogique destiné à la formation et à la recherche. Nous constatons que l évolution des ressources documentaires est liée aux technologies de l information. Cette constatation ouvre un certain nombre de questions : Y aurait-il de nouvelles propositions dans cette évolution liée à l accès à l information? Peut-on déterminer de nouvelles fonctions pour accéder à l information? Comment constituer la source de l information pour sa mise en place? Un des enjeux consiste à rendre plus efficaces les systèmes d information. Les réflexions que nous menons sur l utilisation des systèmes d information aboutissent à enrichir la modélisation de l utilisateur. La prise en compte de la modélisation de l utilisateur nous permet d agencer au mieux cet ensemble d information que l on qualifie d entrepôt de données et de construire des bases métiers destinées à un type d acteur particulier. Nous réfléchissons à l évolution d un Système d Information en un Système d Information Stratégique voire en Système d Information Décisionnel. Comment contribuer à cette évolution? Dans quels buts les réflexions de l équipe SITE permettent d améliorer les systèmes d informations pour satisfaire les utilisateurs finals lors de situation de consultation et/ou de prise de décision? Pourquoi et comment un entrepôt de données permet de proposer des solutions pour faire évoluer un SI en SIS voire en SID. L entrepôt de données permet la mise à disposition des décideurs d indicateurs pour la mise en évidence des causes de certains faits. Par anticipation nous envisageons que l analyse des rôles des différents acteurs permet de dresser des métas données. La classification des acteurs de l université fondée sur leurs activités constitue un élément pris en compte pour la construction des bases métiers Le cadre de l étude Les travaux entrepris depuis 2002, ont permis d analyser les différents «Internet Pédagogiques» mis en place et leur évolution. Nous sommes face à différents problèmes propres à l entrepôt de données de ressources documentaires. Nous évoluons dans un contexte d informations hétérogènes. En effet, nous disposons de sources de données structurées, semistructurées ou non structurées. L enseignement évolue dans un contexte qui change d un point de vue technique, géographique, économique et pédagogique [DUVEAU-PATUREAU, 2003]. Le statut de la connaissance change pour passer du donné au construit, de la vérité à la représentation 158

161 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire négociée, de l appropriation individuelle à l intelligence collective. Le changement du statut de la connaissance implique de mettre une stratégie en place en se posant les questions : Avec quelle technologie? Pour qui? Pourquoi? Avec quelle technologie? Une université abrite des bases de connaissances difficiles à identifier. Nous passons d un simple processus de transferts de fichiers, de partages de documents à une véritable capacité à travailler et à collaborer à distance. Ces possibilités sont importantes pour des institutions qui sont géographiquement dispersées. Les moyens techniques permettent une formalisation, une capitalisation et une mutualisation des savoirs. Cette notion de partage a pris toute son ampleur avec l apparition du «Point à Point» qui favorisent la création d espaces de travail virtuels permettant de partager applications, images, voix, données et fichiers de tous types. Pour qui? Dans un contexte universitaire, à la question pour qui? On peut répondre par les acteurs de l université qui sont : les directions, les enseignants, les étudiants, les personnels administratifs et techniques. Les directions ont intérêt à étendre leur marché, trouver des étudiants, rationaliser les coûts, être visibles, harmoniser, mutualiser et offrir des supports de formation. Les étudiants ont pour but de réussir, apprendre mieux, autrement, efficacement par la construction d un projet professionnel qui doit les aider à trouver un emploi. Pourquoi? A la question pourquoi? On peut énoncer quelques enjeux : résoudre des problèmes liés à la formation, échanger des points de vue, reproduire et innover. Cela permet une délocalisation par rapport aux problèmes de distance, une possibilité d analyse. Les enjeux d un entrepôt décisionnel sont également économiques. La réalisation passe par un coût, il est donc nécessaire d envisager un réinvestissement des documents et leur réutilisabilité sur diverses plate formes. 159

162 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire 5.4. Système d intelligence économique révélateur du processus d intégration Dans notre étude, le SIS universitaire repose sur un Entrepôt de Ressources Documentaires. Nous allons tenter de répondre à la question : comment construire le SID d un environnement pédagogique? Cette construction passe par une phase de collecte des connaissances au profit de conceptions pédagogiques. Il est temps de faire un bilan intermédiaire avant de poursuivre notre cheminement théorique. Comme nous l avons vu nous disposons de données provenant de l Université à partir des logiciels NABUCO, HARPEGE et APOGEE qui sont des SGBD, c est-à-dire des Systèmes de Gestion de Bases de Données. Face aux ressources administratives nous avons des ressources documentaires gérées localement par un SIGB, c est-à-dire un Système Intégré de Gestion de Bibliothèque. Les données issues des SGBD propres à l Université peuvent être valorisées au profit d un Système d Information Documentaire ou Système d Information Décisionnel de l Université. Les données issues du SIGB peuvent être valorisées au profit d un Système d Information Documentaire voire d un Système d Information Décisionnel. Outre le fait que l on observe une onomatopée dans les termes, on voit bien qu un remède à la juxtaposition de données peut s opérer par un processus d intégration. Comme nous l avons fait remarquer précédemment, il s agit de passer de la dimension «infocentre» à une dimension «business processing management». Le Système d Information Global de l Université par intégration du Système d Information Documentaire dans le Système d Information Décisionnel devient un Système d Intelligence Economique (SIE), [SALLES, 2000a]. Système de Gestion de Base de Donnée SGBD SIGB Système Intégré de Gestion de Bibliothèque SIE Système d Information Décisionnel SID SID Système d Information Documentaire Figure : Intégration par le processus de l intelligence économique 160

163 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire Le schéma ci-dessus figue le cœur de notre problématique symbolisée par un engrenage pour illustrer le phénomène «intégration» dans le système d intelligence économique. Pour représenter nos propos, nous poursuivons la modélisation des documents en poursuivant le scénario de mise en correspondance, enseignant et enseigné, par l intermédiaire de média d enseignement. enseignement enseigné Figure : Mise en correspondance enseignant-enseigné La conception de ressources documentaires au service de formations peut être de plusieurs types, dont nous décrirons deux aspects. La conception d une formation peut être : Une transposition de la conception d un document sur papier Un processus plus élaboré de gestion de contenu Transposition de la conception d un document sur papier La conception d une formation peut être une transposition un peu améliorée d un document papier en un document électronique, dans ce cas on aboutit à un parcours linéaire. Cette solution est assez répandue car elle a l avantage d être relativement économique, mais, en contre partie, elle présente de gros inconvénients. Elle n apporte pas de réponses aux différents besoins de l élève au sein d une même formation. Quand un enseignant veut faire des variantes d un même contenu pour répondre à des publics différents, soit il est obligé de faire des ressources différentes en partant de zéro à chaque fois, soit il est amené à construire une navigation si complexe qu elle devient rapidement ingérable. Parcours Figure : Transposition d un document papier sous format numérique 161

164 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire Processus plus élaboré de gestion de contenu Il s agit de séparer des connaissances au sein d un cours. Le recours au XML, permet de séparer le contenu du contenant. Outre le fait qu il est possible de rechercher par mots clés dans l index, on peut restreindre les recherches dans les titres, les en-têtes ou l ensemble de la ressource selon la structuration du document électronique adoptée. Il existe une base de connaissances constituée de modules. Selon un mécanisme d assemblage, il est possible de répondre aux différents besoins d étudiants d UFR différentes. Sql exemple1.xml exemple1.xsd exemple1.xsl exemple1.css Visualisation Etudiant type 1 Etudiant type 2 cours.xml cours.xsd cours.xsl cours.css exemple2.xml exemple2.xsd exemple2.xsl exemple2.css Ldap Visualisation Etudiant type 1 Etudiant type 2 Figure : Processus plus élaboré de gestion de contenus En conclusion la construction d un Entrepôt de Données, passe par un principe de mutualisation. Ceci consiste à utiliser dans un module, des éléments créés par d autres. Dans le cadre de la mutualisation, bien que les considérations techniques existent toujours, elles sont devancées par des considérations de notions de propriété intellectuelle. Après ces considérations, nous sommes en mesure de dire que le recours à un ED n est pas une quête d économie, mais un souci de rationalisation des coûts et un transfert des coûts sur un autre type d activités. Il permet de répondre à la demande actuelle des étudiants, ce qui est de plus en plus difficile par l enseignement traditionnel. Il permet également, grâce à une plus grande personnalisation, d accroître l efficacité d une formation. La modélisation des acteurs permet de déduire : 162

165 Partie II - Chapitre 5 L intelligence économique intégrant la modélisation de l utilisateur dans un contexte universitaire une remise en cause des méthodes de travail un travail de préparation plus important 163

166 164

167 Partie II - Chapitre 6 La modélisation de l acteur 165

168 166

169 6.1. Les acteurs dans l Université Compte tenu du cadre de ce projet universitaire où se côtoient : étudiants, enseignantschercheurs, administratifs évoluant dans des domaines et des disciplines variées du point de vue de leur thématique, la structure informatique que nous proposons est calquée sur le modèle d un entrepôt de données proposé par [FRANCO, 1997b], tenant compte des différents métiers. Par exemple une personne peut avoir des responsabilités différentes : elle peut avoir le statut de responsable, d enseignant ou de missionnaire. Nous abordons les données relatives aux acteurs par différents niveaux. Nous distinguons trois niveaux : le niveau acteur, le niveau administratif et le niveau enseignement. Le niveau acteur permet une première typologie des acteurs autour de 3 classes, qui fait apparaître des étudiants, des enseignants et des administratifs. Le niveau enseignement permet d identifier des bases «référents» corrélées avec les acteurs précédemment identifiés : des bases de cours plutôt destinées aux étudiants, des bases de références au service des enseignants et des bases de textes réglementaires à la destination des administratifs. Le niveau administratif recense des données relatives à la situation administrative de l acteur étudiant, des données relatives à la situation administrative de l acteur enseignant et des données de gestion administrative et financière des étudiants, des enseignants et des formations utiles à l acteur administratif. Illustrons par un schéma ces données relatives aux acteurs [AMUE, 2003], complété par l existant. 167

170 Niveau acteur Etudiants Enseignants Administratifs Niveau enseignement Bases de cours Bases de références Bases de textes Niveau administratif Situation administrative de l'étudiant Situation administrative de l'enseignant Gestion administrative des étudiants, des enseignants, des formations L existant APOGEE HARPEGE NABUCO, ASTRE Figure : Données relatives aux acteurs Comme on le constate sur la Figure 6.1-1, le système d information initial propose des bases existantes que l on pourra exploiter. Ces bases existantes servent à un groupe précis afin d augmenter leur efficacité dans un domaine [IMPACT, 2002]. Il existe des sources de données pour des groupes particuliers d acteurs. Cependant, ces sources sont conçues indépendamment les unes des autres. Elles sont souvent parcellisées, n ont pas forcément de cohérence. Leur corpus de données peut différer d une entité à l autre. La représentation des données est parfois différente. On peut avoir affaire à des bases malpropres ou s apercevoir de champs utiles manquants. Par rapport aux nouveaux publics, l indexation s avère inappropriée et peut avoir recours à des codes différents. En devenant des instruments de communication à destination d autres publics, elles doivent subir des adaptations. Il est possible d exporter les données de ces bases dans différents formats, notamment en format texte, pour ensuite en tirer parti. Le fichier des étudiants tiré d Apogée 107 permettait déjà en 2002, de constituer les logins pour qu ils puissent se connecter à des stations de travail et de disposer de boîtes aux lettres. Un système d authentification plus élaboré a été mis en 107 Apogée, Application pour l'organisation et la gestion des étudiants, apporte des réponses précises en matière de clarification de l'offre de formation, d'amélioration de l'accueil des étudiants, de gestion de la scolarité et de pilotage de l'établissement. 168

171 place depuis lors. Il repose sur le Ldap de l Université et est couplé à un système d authentification pour l accès aux stations de travail qui repose sur l Active Directory Contextualisation de la problématique par une analyse préalable Schéma global Le paragraphe précédent a mis en relief différents niveaux reposant sur des bases existantes. On repère que ces bases abritent des données qui peuvent être utiles aux différents niveaux. Elles peuvent être utiles à la fois en terme de qualité : de signalement, de production et d analyse. Par combinaison, elles peuvent alors devenir des données de qualité de prospection au service de phénomène d anticipation. L anticipation peut se situer à un niveau pragmatique pour la gestion de l université et son positionnement sur un plan régional, national voire international ; dans ce cas la gestion concerne les ressources financières et humaines. L anticipation peut également se situer à un niveau pédagogique et documentaire. Le niveau documentaire étant au service de la pédagogie dans un contexte d apprentissage et complémentaire dans un contexte d auto apprentissage et de production de documents électroniques. Au niveau des acteurs, on met également en évidence un phénomène d anticipation comportemental lors de l utilisation d un système d information. Ces observations nous amènent à des réflexions en terme organisationnel au niveau des systèmes d information en place dans l optique d une intégration au système d information global de l université. Si on considère le niveau de l existant, dans notre cas, il est nécessaire de pouvoir croiser des données de ces bases existantes. Nous sommes face à des bases gérées par des services différents, construites à l aide de standards techniques pas toujours inter opérables. On peut y remédier. L entrepôt de données et la mise en oeuvre d un data warehouse donne des solutions pour rendre interopérable des bases de données. Pour notre étude, l entrepôt de données permet de définir des corpus communs de données, des référentiels choisis, des formats de description de données. Nous pouvons enregistrer des données à l aide de tables communes pour définir un certain niveau de cohérence. 108 Active directory est un annuaire au sens informatique chargé de répertorier tout ce qui touche au réseau comme le nom des utilisateurs, des imprimantes, des serveurs, des dossiers partagés, etc. L'utilisateur peut ainsi trouver facilement des ressources partagées, et les administrateurs peuvent contrôler leurs utilisations grâce à des fonctionnalités de distribution, de duplication, de partitionnement et de sécurisation des accès aux ressources répertoriés. 169

172 Au sein d un entrepôt de données, dans un contexte pédagogique, il s agit de concevoir des bases prenant en compte des fonctionnalités spécifiques. Le schéma ci-dessous représente les sources existantes concernant nos publics qui peuvent alimenter un entrepôt de données. Cet entrepôt doit répondre aux besoins des différents acteurs. Les acteurs pourront tirer parti de bases métiers filtrées et adaptées à leurs besoins. La Figure permet de corréler les besoins des utilisateurs et les bases métiers. Sources Etudiants Sources Enseignants Entrepôt de Données Fiche d inscription Modalités de contrôle Liste Information Enseignants Emploi du temps Dossier d habilitation Diplôme Occupation des salles Pérennité format lisible dans le futur Fiabilité valeur Adapté notion de filtre B E S O I N S Sources Administratifs Base Métier Etudiants Base Métier Responsables Base Métier Administratifs Base Métier Enseignants Figure : Bases métiers dictées et adaptées aux utilisateurs finals Notre approche de filtrage de l information par le profil de l utilisateur [DAVID et THIERY, 2001] est donc fondée sur la modélisation de l utilisateur en intégrant des attributs d identification de l utilisateur, de son comportement et du contexte d utilisation des informations qu il cherche. Le processus du filtrage de l information lors de la constitution de l entrepôt de données s opère par un filtrage thématique et dans la constitution des bases métiers par un filtrage fonctionnel. Voici quelques questions relatives : Au besoin d information sur la discipline pédagogique : Pourquoi? Pour rapprocher les étudiants et les enseignants ou pour gérer les groupes de TD et de TP. Ici le point d ancrage est la discipline pédagogique. 170

173 A la décompartimentation des services de gestion : Pourquoi? Toutes les informations doivent pouvoir servir à tous les utilisateurs d un campus. On le perçoit au niveau décisionnel. C est identique au niveau du système d information. Cette transversalité fait appel au rapprochement des données [NATAF, 2002]. Au moteur de rapprochement qui peut varier : Comment? L entrepôt de données. permet de faire des tables de correspondance. Le système d information met à disposition des moteurs de rapprochement plus incisifs. Les bases métiers sont créées par rapport aux usages et par rapport aux fonctionnalités dont ont besoin les acteurs. Si on met ce schéma en perspective avec la Figure : Système d information décisionnel et processus, on remarque que la prise en compte en amont des besoins de l utilisateur final lors de la fabrication de l entrepôt de données, implique une rétroaction entre l amont et l aval du data warehouse. Nous sommes bien dans une situation de suite de processus propre à un système d information décisionnel. Les besoins des utilisateurs s inscrivent dans cette boucle de rétroaction entre le back office et le front office, puisqu ils évoluent constamment. Il s agit pour nous de définir un modèle de l utilisateur qui devra prendre en compte ses besoins Comment penser un modèle par rapport aux acteurs de l université? Nous sommes amenée à penser un modèle de l acteur dans un contexte en évolution constante du point de vue des réformes de l enseignement, de la conformation actuelle et future de l université, des technologies informatiques, des normes et des standards. Pour passer en revue les acteurs nous les observons dans un premier temps de façon à repérer des pistes qui pourraient être prise en compte pour la suite de nos travaux Vers l étudiant actif Rappelons une étude [PEGUIRON, 2001] que nous avions menée en 2001 sur le comportement d étudiants dans une salle multimédia. Nous avions mis en évidence les tendances et les pratiques des étudiants lors de l usage d une station de travail. Notamment nous avions pu mettre en évidence l utilisation importante de plusieurs outils en même temps, avec un phénomène de zapping. Les étudiants naviguent, ont recours à plusieurs messageries, disposent dans la grande majorité d un compte de messagerie instantané et discutent simultanément avec d autres internautes. Dans le cas où un utilitaire est absent de la station, 171

174 ils savent où le trouver sur la toile et l installer. Ils s entraident mutuellement dans les situations qu ils ne maîtrisent pas. On note plusieurs traits de caractère importants. Par exemple ils font preuve d un esprit d autonomie, de créativité et de contribution. L utilisation de ces outils tend à favoriser et à développer ces capacités. Processus propres à l étudiant Dès le début de nos recherches et avant même de penser de façon pragmatique au recensement des besoins des acteurs, nous avons eu la démarche d observer la jeune génération ou la «millenial generation» ou encore la génération du troisième millénaire au travers de deux types de jeux. Nous avons été interpellée par les «cartes magic» et la quantité d informations contenues sur un micro support à l image des métas données que l on pourrait définir autour d un profil d utilisateur. Décrivons une carte sous l angle d un micro contenu : Combinaison des 2 notions = coût total Identité Notion de coût : mana Notion d obligation Support à l imagination. N a pas effet dans les règles Combinaison des 2 notions = Caractère de la carte Type de la carte Créature Rituel Ephémère Enchantement Artefact Race=sous catégorie Valeur de la carte selon le créateur du jeu + Mention d édition Description Règles propres à la carte Illustrateur Force Endurance Caractéristique physique dans le cas d un personnage Figure : Informations sur un micro contenu 172

175 Pour mémoire les cartes magic sont apparues dans les années Résumons en quelques phrases comment elles sont utilisées. Toutes les cartes magic tournent autour du même scénario : deux sorciers ou plus s affrontent. Ils invoquent des créatures qui combattent pour eux, lancent des sorts bénéfiques ou maléfiques. Le but étant de réduire les points de vie initialement à vingt de ou des adversaires à zéro. Ces cartes font fonction de support d information pour représenter les sorts lancés. Les informations sont relatives à la fois à des concepts (support à l imagination, notion d obligation), ce qui leur confère un niveau d abstraction et concernent aussi des caractéristiques concrètes (identité, notion de coût, type de la carte, race, sous-catégorie, force, endurance). La combinaison de certaines notions constitue des informations supplémentaires. Sont ajoutées sur cette carte des informations qui donnent des indications sur la carte en tant qu objet (valeur de la carte, illustrateur, mention d édition). Toutes ces informations font fonction de métas données qui à tout moment au cours de la partie donnent des informations en lien avec le contexte du déroulement du jeu. Les joueurs évoluent dans un environnement bâti et maîtrisé par eux-mêmes. Au sein du jeu, ils pratiquent le «troc» - on observe que cette notion d échange crée un nouvel habitus qui dépasse le cadre de la vie virtuelle pour la «millenial generation». Par l intermédiaire de cartes magic les individus appartiennent à un groupe, ce qui leur confère un rôle social. Nous remarquons que ce jeu détient sans le support de l informatique tous les aspects d une vie virtuelle qui procurent des sensations d appartenance à un groupe, de conquête, de victoire, d échec et de partage. Isolés, face à leur station, de retour dans leur foyer! ce sont ces types de sensations que les joueurs tentent de prolonger pour devenir alors selon l expression consacrée des homazapiens voire des homomédiatis. Attardons nous sur le concept du jeu en réseau qui fait appel aux capacités cognitives précédemment décrites, capacités qui s enrichissent dans des situations de jeu partagé et à distance. Souvenons-nous des premiers jeux sur PC apparus dans les années 1990 tel le jeu Ultima Online par exemple. Les premières versions étaient en mono poste. Les joueurs âgés entre 15 et 20 ans à cette époque en quête de jeu en réseau déplaçaient leur micro-ordinateur pour développer des mini-réseaux afin de jouer à plusieurs. Nous pouvions dénoter là un fort esprit d initiative et de construction, avec le souci de partager des instants forts. Accessible à partir de 1997 via l Internet, nous avons pu voir alors s organiser des communautés qui avaient à leur disposition un jeu avec un environnement très élaboré et des portails dédiés riches en informations sur l évolution du jeu. 173

176 Pour résumer la thématique du jeu Ultima Online, nous pouvons dire que c est une virtualisation de la vie où il s agit de faire vivre et progresser des personnages appartenant à des guildes dans un nouveau monde. Entraînement physique, alimentation des personnages, domestication d animaux, combats, constitution de guildes sont les principales activités du joueur qui peut s identifier à son personnage. La figure ci-dessous décrit une partie des informations mises à la disposition du joueur. Par rapport aux cartes magic les informations s enrichissent de nombreux items comme par exemple des historiques (historiques des objets possédés, historiques des forces acquises), des fiches métiers, des informations d appartenance à une guilde. Les joueurs évoluent dans une micro société où se côtoient différentes castes. Commandes et information sur la situation du personnage Fiche métier Catégorisation des outils pour leur création Caractéristiques du personnage Vie Mana Endurance Classe sociale Pseudonyme Caste d appartenance Inventaire des objets possédés par le personnage Figure : Informations relatives à différents niveaux d abstraction L environnement du jeu comporte un espace où évoluent les personnages sur des cartes géographiques avec la possibilité de zoomer sur des endroits. Les personnages discutent en temps réel, sauvegarde automatiquement leur partie sur le serveur d Ultima Online. Pour les joueurs avertis, ils ont la possibilité d effecteur des macros et interviennent directement sur la partie cliente du logiciel. Par exemple, s il est astucieux ou un peu tricheur le joueur est en 174

177 mesure d intervenir sur les scripts pour faire avancer artificiellement son personnage. Les joueurs sont dans un monde très visuel où l image a une imprégnance forte au sein de «rooms» qui rassemblent les guildes et illustrent des microcosmes par affinités. Ces observations complètent nos premières remarques sur les capacités cognitives des jeunes gens nés après les années Ils sont en mesure de combiner de nombreuses informations de différents niveaux d abstraction. Ils font appel à des informations textuelles, sonores, imagées lors de leurs activités ludiques. Ils privilégient les fonctions d interactivité (télécharger, discuter) et apprécient de pouvoir faire appel à leur créativité. Les rooms ou espaces partagés illustrent le contexte de leur champ d action. Si nous nous tournons outre atlantique notre démarche est confortée par les travaux de recherche entrepris par [SWEENEY, 2005] qui fait référence à un article paru dans strategy+business, où [PRENSKY, 2004] donne un conseil avisé aux entreprises qui cherchent à se réorganiser pour devenir plus réactives. Voici rapportés certains de ses propos : demandez l avis aux plus jeunes, ces «indigènes du numérique» qui, à 25 ans tout au plus, ont près de heures de vol sur des jeux vidéo, envoyé et reçu plus de courriels et messages instantanés. «cette génération est plus apte à absorber l information et prendre des décisions rapides, au multitâches et au calcul parallèle» que les «immigrants du numériques», ces vieillards âgés de plus de 30 ans. C est donc auprès d eux qu il faut trouver les sources de la transformation des entreprises. Richard Sweeny propose dans la revue NJIT un tableau intitulé «MILLENNIAL CHARACTERISTICS» que nous restituons ci-dessous où sont proposées en anglais les caractéristiques qu il a pu observer pour la génération du troisième millénaire. Principled /Values More Friends More Diverse Respect Intelligence Optimistic /Positive Internet Natives More Choices Format Agnostic Balanced Lives Adaptive / Flexible Civic Minded High Expectations Collaborative Nomadic Gamers Experiential Independent Confident Direct More Liberal Multi-taskers Inclusive Patriotic Entrepreneurial Healthy Lifestyle Family Oriented Graphical Achievement Oriented Tableau : MILLENNIAL CHARACTERISTICS selon Richard Sweeny Richard Sweeny pousse la prospective jusqu à prouver ses travaux de recherche par le recours à l imagerie médicale à base de résonance magnétique nucléaire. Pour cela il pratique 175

178 l analyse de cerveaux de personnes appartenant à des tranches d âge différentes. Il démontre par l image que les cerveaux de la millenial generation comportent des zones mieux «connectées» sur un plan neuronal. Quelques pistes dégagées Ces notions, quant au comportement cognitif des étudiants, révélées par l observation sont à prendre en compte dans le développement ou l urbanisation d un système d information universitaire. Ces différents modes d accès à l information confèrent aux étudiants une nouvelle lecture ou plus exactement une nouvelle perception des messages. L évolution cognitive d un étudiant en situation de jeu nous amène à proposer une architecture fonctionnelle fondée sur diverses habitudes évocatives identifiées également en situation d apprentissage et qui sont : le processus d observation, le processus d acquisition de connaissance, le processus d application de la connaissance, le processus de créativité. L ingénierie pédagogique dont le rôle est la transmission, est en mesure de passer à une ingénierie d apprentissage en favorisant la création. Les apprenants peuvent passer de produits à consommer à des créations de services. Ce système rend l étudiant acteur et autonome : il peut être coproducteur du système d entrepôt de données en vue d augmenter l efficacité du système Enseignant en situation d élaboration d un cursus Processus propres à l enseignant Pour aborder le contexte de l enseignant dans un espace numérique de travail reprenons une citation de Joël de Rosnay : «Avec la pratique des réseaux, le professeur peut se transformer en passeur, plutôt que se cantonner dans son rôle traditionnel de pasteur». L enseignant est placé à la fois dans un environnement d innovation et aussi dans un environnement réglementé auquel il doit se conformer. L enseignant élabore un cours en s appuyant sur des textes d habilitation, processus qui lui suggère des idées. L enseignant développe ses idées au sein de formations. Des veilleurs du ministère de tutelle observent l évolution de ces formations en utilisant les textes d habilitation. Ce processus cyclique entre élaboration de cours de l enseignant et prise en compte par des experts du ministère constitue un enjeu important lors de la réforme du LMD pour l habilitation de formations diplômantes dans l université. 176

179 Textes d habilitation L enseignant a des idées L'enseignant développe des idées au sein des formations Figure : Un exemple de mise en situation d un enseignant lors de création de cours. Cet état s exprime dans un contexte de concurrence entre les universités. A cette situation de concurrence vécue par les enseignants s ajoute une autre problématique qui touche l accès au savoir. Les étudiants ont désormais la possibilité d atteindre des bases de cours en libre accès sur la toile. Sur un plan relationnel, cela aboutit à des modifications du rôle de l enseignant. Il passe du rôle d enseignant à celui d auteur et de ce fait acteur du système en phase de production. Il se voit également renforcé dans son rôle d expert où il alors pourra aider à valider ou invalider les informations trouvées par les étudiants eux-mêmes. La prise en compte de ces enjeux constitue à la fois des besoins propres à l enseignant et au responsable de composante révélés en amont de la conception du système d information. Cela suscite d ors et déjà des idées autour de solutions pour la facilitation de la mise en œuvre des processus propres à l enseignant ou au responsable. Quelques pistes dégagées Par recoupement de l information, l enseignant peut trouver des textes d habilitation et des cours au sein de bases de données. On peut proposer un système d affiliation qui favorise un parcours entre textes d habilitation et cours. L enrichissement des documents électroniques à l aide de descripteurs concourt à un ciblage prospectif de l information. L'enseignant Bases de données de règlements Bases de données de cours A F F I L I A T I O N Des habilitations <descripteur thématique> Des cours <descripteur thématique> Notion de descripteur Figure : Relation entre descripteur et affiliation 177

180 Cet exemple fait apparaître la notion de description de données, c est-à-dire de métas données. Ces métas données constituent un verrou en tant que passerelle entre des documents électroniques appartenant à la fois au niveau administratif et au niveau pédagogique Les administrations Les administrations réalisent que, plutôt que retenir l information, elles gagnent à la diffuser pour résoudre des problèmes, échanger des points de vue, reproduire ou innover. Innover est probablement l étape la plus difficile : des études ont été menées pour prouver qu à toute idée nouvelle qui n émerge pas de sa propre imagination, l individu a une forte tendance à dire «Non» et à s opposer d emblée. C est pourquoi certaines entreprises adoptent une stratégie qui consiste à mettre les personnels autour d une table qui expriment leurs idées librement en évitant au maximum de se censurer mutuellement. C est d ailleurs, un exercice qui est grandement facilité dans les forums de discussion via le net où il est possible de faire abstraction des réactions morphologiques des interlocuteurs qui de ce fait peut influencer le discours. Les participants ajustent leur propos par rapport aux réactions du visage, des attitudes de leurs interlocuteurs ; attitudes que l on regroupe sous le terme de kinémimique. Pour exemple [CANSELL, 2003] développe dans son article un service appelé le club IE dont le principe de fonctionnement repose sur le brainstorming. L'intelligence économique telle que développée au sein de Giat Industries passe par deux fondamentaux : l'émergence d'une conscience collective des enjeux de l'ie et la création d'une capacité de mobilisation et d'exploitation des ressources disponibles. Au sein de certaines administrations, des décideurs estiment que le pouvoir glissera de celui qui a la possibilité de retenir l information à celui qui saura diffuser l information, dans des conditions satisfaisantes de pérennité, des informations fiables, précises, et adaptées à chaque demande spécifique. Développons quelques principes sur la Gestion des Connaissances abordées en paragraphe 3.2. Les connaissances sont un aboutissement de savoir et de savoirs faire amassés, analysés, capitalisés, partagés au sein d un groupe afin d optimiser, d innover, de progresser. Les différents niveaux de la connaissance renvoient à des corrélats techniques : le savoir-faire, le savoir-produire, le savoir-penser. Gérer les connaissances, c est gérer leur inscription documentaire c est-à-dire : définir des langages et des formats d expression, définir des conditions techniques d écriture et de lecture, constituer une tradition de lecture et d appropriation, constituer une communauté de lecteurs qui se transmettent et perpétuent la connaissance. Dans un contexte d'apprentissage Organisationnel les acteurs réutilisent les informations acquises pour traiter des données nouvelles de l environnement. Les acteurs de 178

181 l'organisation ne se limitent pas à la consommation d'informations, ils sont également producteurs d'informations pour favoriser les échanges et pérenniser la capitalisation des connaissances. Quelques pistes dégagées L Université dispose d une masse énorme d information. Les informations sont essentiellement accessibles sous forme de tableau au format Word ou Excel. L Université met également à disposition en Intranet des formulaires utiles à la vie administrative sous format PDF et DOC. Au terme des premières recherches menées au cours de l année 2002, l existant fait apparaître clairement qu elle dispose de bases de données que sont les logiciels de gestion : APOGEE, HARPEGE, NABUCO. Ces logiciels ont été déployés sur un plan national sous la houlette de l Agence de Modernisation des Universités [AMUE, 2002] pour représenter une cohérence dans les gestions administratives des universités. Nous avons eu alors l idée d exploiter les données existantes de l Université que nous pouvions récupérer à partir de ces logiciels de gestion. Il s agit d affiner les données utiles qui constitueront l entrepôt de données avec l idée d aider une meilleure prise de décision. Nous nous appuyons également sur les différents projets menés au niveau national. Cet état constitue une piste pour nos recherches afin de faire «dialoguer» des données provenant de niveaux différents de façon à faire augmenter le degré d information sur le système d information global. Pour conclure nous constatons qu à l inverse de ce que Jasques Ellul citait pour les médias traditionnels «L'homme n'a pas de besoins. Il faut lui en créer» un système d information universitaire pour être performant doit tenir compte des besoins spécifiques de chaque acteur. L observation que nous venons de faire autour des différents acteurs permet de dire que l usage des technologies a des conséquences sur les comportements cognitifs des individus. Nous faisons également référence au concept de la médiologie qui nous rappelle ce que l homme fait à ses outils et ce que ses outils font à l homme. La prise en compte par des ethnologues et sociologues d hier «l effet-retour» est aujourd hui reprise par des technologues et des épistémologues comme Régis Debray [DEBRAY, 1991], Pierre Lévy [LEVY, 1997]. Au moment où nous écrivons ces mots, nous revient à l esprit le film de Stanley Kubrick «2001 l Odyssée de l espace» et plus particulièrement la première scène où un grand singe à l aube de l humanité se sert d un os en guise d arme qu il jette en l air, le fémur alors se transforme en navette spatiale. En quelques secondes Kubrick symbolise la théorie de l évolution de Darwin où l arme ou plus exactement l outil est objet de communication 179

182 intersidéral pour mettre en relation des espaces distants d année lumière. Pour finir avec l imaginaire, nous pourrions nous poser la question de savoir si les observations de Richard Sweeny sur les capacités du cerveau développées dans certaines conditions sont transmissibles aux générations suivantes à l instar de la mémoire génétique évoquée dans la mythologie de Dune de Franck Herbert? Voilà qui nous rapprocherait de l homme symbiotique de Joël de Rosnay! Mais quittons le domaine de la science fiction pour adopter une démarche pragmatique. Suite à la phase d observation nous proposons de classifier les acteurs autour de leurs activités Classification des acteurs fondée sur leurs activités Pour agencer les bases métiers nous nous fondons sur les activités des acteurs de l université, que nous avons précédemment identifiés. Il est nécessaire de recenser tous les acteurs et ensuite de les regrouper par leurs activités. Le profil des activités doit permettre de répondre notamment à la question : Quels sont les problèmes à résoudre? Reprenons la Figure : Bases métiers dictées et adaptées aux utilisateurs finals, afin d analyser la corrélation entre les besoins, le filtre et les bases multidimensionnelles. Les filtrages thématiques et fonctionnels favorisent la création de bases métiers en tenant compte des activités recensées en amont ; ces activités englobant un certain nombre d opérations. Etude préliminaire Pour mettre en évidence les activités des utilisateurs, en 2002 nous avons entrepris de les catégoriser par type d acteurs. Chaque type d acteurs nécessite, également d être sous catégorisé comme nous le proposons par exemple de cette façon : 1 er cycle, 2 e cycle, 3 e cycle 109, directeur d UFR, responsable d équipe de recherche, enseignant-chercheur, non enseignant, secrétaire général, gestionnaire de missions, gestionnaire financier. Le tableau cidessous met en valeur les besoins et les rôles des acteurs. Cette méthode met en évidence les fonctions utilisées lors de la recherche d information. La notion de temps permet de mesurer la variation des activités selon le moment de l année. Il est également utile de quantifier chaque rubrique afin d évaluer le volume des activités er cycle, 2 e cycle, 3 e cycle deviennent Licence, Master Doctorat dans le contexte actuel de l enseignement supérieur. 180

183 Tableau : Besoins, rôles et fonctions des acteurs Nous reprenons le Tableau pour procéder à des quantifications des besoins, fonctions et activités par rapport au temps. Exploitation de l étude préliminaire Le passage par ce tableau permet la mise en évidence d un certain nombre d éléments autour des activités des utilisateurs. En nous appuyant sur une composante (ici les sciences du langage), nous avons ainsi pu classer nos utilisateurs autour de quatre types d acteurs qui sont : les étudiants, les responsables, les enseignants et les administratifs. Le Tableau

184 indique les besoins et les rôles des acteurs et montre les fonctions utilisées lors du processus de recherche d information. La quantification de chaque item permet la quantification du volume des activités au cours du temps, tirons en partie : i=n j= n k= n-1 Acteur = T i ; Σ F j ; Σ B k ; Σ A l i=1 j=1 k=1 Équation 1 : Formule 1 autour de l acteur par rapport aux types, fonctions, besoins et activités i=n j= n k= n-1 Acteur = T i ; Σ F j ; Σ B k ; Σ A l i=1 j=1 k= Acteur = T (1 i 4) ; Σ F (1 j 21) ; Σ B (1 k 59) ; Σ A (1 l 92) Équation 2 : Formule 2 obtenue après quantification de la formule 1 Nous pouvons préciser les résultats autour des activités et des besoins par rapport au temps, les fonctions ayant toujours la même valeur au cours de l année. Pour être plus précis, nous évaluons les besoins et les activités des acteurs sous catégorisés. Nous mettons en relation trois tableaux autour des fonctions, des besoins et des activités. Ceci nous permet d affiner les calculs à partir des formules précédemment définies. f Année nbre o administrer 3 n conseiller 2 c apprendre 3 t manager 5 i missionner 1 o organiser 1 n enseigner 6 s Total 21 Début d'année Milieu nbre d'année Fin nbre d'année nbre b cours 6 cours 8 examens 8 e budget 3 déploiement 3 corrections 6 s inscription 3 organisation 2 évaluation 4 o recensement 2 planification 2 conformité 3 i déploiement 1 dépenses 1 emploi 1 n règlement 1 projet 1 stage 1 s stage 1 recettes 1 rédaction 1 Total = a Début d'année nbre Milieu d'année Fin nbre d'année nbre c dépôt 10 exploration 9 interactivité 10 t interactivité 5 interactivité 9 analyse 7 i exploration 9 dépôt 8 annotation 7 v interrogation 2 synthèse 7 i dépôt 7 t exploration 2 é Total= s Tableau : Evolution des besoins et des activités au cours de l année 182

185 Le Tableau fait ressortir des chiffres que nous pouvons exprimer à l aide de la formule 2 : Acteur = T (1 i 4) ; Σ F (1 j 21) ;Σ B (1 k 17 ; Σ A (1 l 26) debut année Équation 3 : Application de la formule 2 en début d année Acteur = T (1 i 4) ; Σ F (1 j 21) ;Σ B (1 k 18 ; Σ A (1 l 26) milieu année Équation 4 : Application de la formule 2 en milieu d année Acteur = T (1 i 4) ; Σ F (1 j 21) ;Σ B (1 k 24 ; Σ A (1 l 40) fin année Équation 5 : Application de la formule 2 en fin d année Ces calculs nous permettent d obtenir plusieurs séries de graphes dont nous retenons celui-ci pour observer la représentation des activités. Questionner Analyser Annoter Synthétiser Télécharger Explorer Interagir D M L Dir Dir Prof Non Resp Vacataire Sec Gest Gest UFR Enseig Rech Gal financier mission Graphique : Représentation en histogramme de la relation entre les activités et les acteurs sous catégorisés 183

186 Nous remarquons la relation entre les activités et les acteurs sous catégorisés. Le recours à ce type de représentation des données aide à mettre en évidence des particularités. Le graphique montre que certains acteurs n ont pas d activité d analyse et qu un nombre restreint d acteurs a des activités de synthèse. Nous avons pu mettre en évidence des activités par rapport à des périodes. Par exemple : les fonctions de certains acteurs comportent la même valeur pendant le temps, mais leurs besoins et leurs activités varient pendant l année. Au terme de cette étude préliminaire nous pouvons dire qu un acteur est représenté par un type (T), des fonctions (F), des besoins (B) et des activités (A). RU = (T, B, F, A) Dans une première étape les items qui constituent la représentation de l utilisateur peuvent être développés comme suit : T {Etudiants, Responsables, Enseignants, Administratifs} F {apprendre, enseigner, diriger, missionner, organiser, gérer, conseiller} B {inscription, exercice, formation, emploi, projet, corrections, recensement, organisation, évaluation, budget, déploiement, conformité, planification, textes officiels, dépenses, recettes} A {explorer, interroger, analyser, synthétiser, annoter, intégrer} Nous tiendrons compte de ces multiples observations pour développer nos bases métiers. En analysant les activités utilisées sur le système d information, nous pouvons en déduire le type d acteur. Nous pouvons aider l acteur identifié par anticipation, en lui proposant des informations supplémentaires pour améliorer les résultats de l utilisateur. Pour vérifier et améliorer l association des besoins des utilisateurs avec leurs fonctions, nous utilisons des outils pour analyser à l aide de rapports les comportements des utilisateurs. Contexte Nous avons pu voir au cours de nos recherches que les logiciels administratifs au sein des universités, ont des limites au niveau du pilotage. Un système d information informatisé permet une exploitation de données sans ambiguïté et exclut l aléatoire dans les processus et 184

187 les événements. Apogée 110, par exemple, qui permet l inscription administrative et pédagogique de chaque étudiant, requiert une modélisation dépendante de chaque établissement. Apogée permet d avoir la répartition des étudiants par diplôme en croisant les instances de l objet «individu» et les instances de l objet «diplôme». Toutefois, la modélisation étant très figée dans Apogée, des requêtes de pilotage pertinentes ne peuvent pas être définies dynamiquement au fur et à mesure des besoins. Comme par exemple l impossibilité de répondre à la question : le nombre de redoublants pour le 2 e cycle, car le système n a pas pris en compte la notion de redoublant et ne peut pas évoluer pour l appréhender. Néanmoins, lors de la mise en route du processus de modélisation des acteurs : étudiants, enseignants, administratifs nous mettons en évidence que nous pouvons récupérer des données au niveau de ce logiciel afin de faire le lien entre enseignant, enseigné et enseignement. Nous évoluons dans un contexte universitaire où il s agit de mettre en relation information et acteurs du SI SIS. Au chapitre 4 de cette partie II, nous avons montré comment définir des classes d objet par le recours aux normes et aux standards pour décrire les documents électroniques. A présent nous allons nous employer à modéliser les acteurs. La modélisation permet d élaborer des corrélations entre type d information et type d acteur afin d améliorer les réponses du système Processus de modélisation Les paragraphes précédents ont permis de dresser une classification des acteurs où nous disions qu un utilisateur (U) est représenté par un type (T), besoins (B), fonctions (F), et activités (A) selon cette formule : RU = (T, B, F, A) que nous exploitons dans ce qui suit. La prise en compte de la représentation de l utilisateur se situe en amont du processus du schéma directeur pour l élaboration de l entrepôt de données. Le schéma directeur des espaces 111 numériques de travail précise les usagers amenés à intervenir dans cet environnement. Ceci permet de mentionner les utilisateurs concernés par notre réflexion. Nous nous appuyons dans ce travail, sur les idées développées par des pédagogues reconnus, sur l apport des TIC (Technologies de l Information et de la Communication) et sur nos observations précédemment décrites. 110 Apogée, Application pour l'organisation et la gestion des étudiants, apporte des réponses précises en matière de clarification de l'offre de formation, d'amélioration de l'accueil des étudiants, de gestion de la scolarité et de pilotage de l'établissement. 111 Un espace numérique de travail désigne un dispositif global fournissant à un usager un point d accès à travers les réseaux à l ensemble des ressources et des services numériques en rapport avec son activité 185

188 Revenons à la pédagogie de Célestin Freinet [MOUVEMENT] ( ), qui théorise sa pratique grâce à ses contacts avec Piaget [UNIGE] ( ). La théorie Freinet est centrée sur l apprenant et fondée sur les principes suivants : expression communication création, autonomie, responsabilisation, socialisation, coopération et vie coopérative, apprentissages personnalisés, ouverture sur la vie, tâtonnement expérimental, méthode naturelle. Les différents concepts de Piaget autour de l apprenant, se résument par : l adaptation, l assimilation/accommodation, les schèmes, la construction par paliers, la conceptualisation, les régulations. Dans les paragraphes suivants, nous allons développer les items T : type, F : fonctions, B : besoins et A : activités des acteurs par rapport au système d information Type L item T représente le type d acteur pour l enseignement supérieur que nous résumons de la façon suivante : T {Etudiants, Chercheurs, Enseignants, Responsables, Personnels, Partenaires, Administrateurs}. Nous utilisons le formalisme UML pour modéliser les types d acteurs. UML est un langage de modélisation unifié et non une méthode. Il contient les éléments constituants de tout langage, à savoir : des concepts, une syntaxe et une sémantique. De plus, UML possède une notation sous forme visuelle graphique fondée sur des diagrammes. Empruntons à UML les diagrammes de classe et d objets pour nous permettre de recenser des objets et des classes (sans les opérations) dans les données fournies sur les maquettes de cours tirées d Apogée. L étape de modélisation de classes d objets permet de faire apparaître des attributs et des valeurs comme nous l avons fait pour les ressources électroniques. La modélisation des types d acteurs sur la figure 6.5-1, permet de dresser des catégories d acteurs et des sous-catégories d acteurs. Cela permet d introduire les notions de groupes, de sous-groupes et de leurs rôles respectifs, notions qui seront développées au cours de l expérimentation. 186

189 Figure : Modélisation des types d acteurs Besoins Ivan Illich ( ) disait dans son ouvrage, «Une Société sans école», édité en 1971, qu un véritable système éducatif n impose rien à celui qui instruit, mais lui permet d avoir accès à ce dont il a besoin. Cette citation s inscrit dans un manifeste utopique pour une société déscolarisée. Il poursuit en disant : «la technologie pourrait fournir à chaque homme la possibilité de mieux comprendre son milieu, de le façonner de ses propres mains, de communiquer mieux que par le passé. Cette utilisation de la technologie, à rebours des tendances actuelles, constitue la véritable alternative au problème de l éducation». L enseignant [PEGUIRON et DAVID et THIERY, 2003] est placé à la fois dans un environnement d innovation et aussi dans un environnement réglementé. Dans un contexte universitaire, l enseignant a besoin de répondre aux besoins des étudiants, de préparer des formations, de créer des formations, de connaître l impact d une formation, d évaluer le contenu des formations, d adapter les formations, d évaluer les connaissances des étudiants. L enseignant cherche à rationaliser la préparation des cours, de voir garantie la propriété intellectuelle et d obtenir une reconnaissance de ses cours au niveau de sa carrière. Besoins de l acteur étudiant : Identification Pour élaborer la base métier à l égard de l étudiant, repartons du Tableau pour préciser les besoins des étudiants : 187

190 Acteur Temps Fonctions Besoins Etudiant Début d année Milieu d année Inscription Renseignements académiques Accès au dossier Mot de passe Changement de mot de passe Obtenir son code Consulter ses coordonnées Faire son changement d adresse Paiement inscription S abonner à des services Accéder aux bases de données Accéder aux revues électroniques Consulter cours Consulter exercices Consulter corrigés Consulter sujets d examens Consulter notes Consulter planning Déposer projets Déposer prises de cours Messagerie Fin d année Stage Recherche de stage Consulter les procédures Consulter les conventions Consulter les offres de stage Déposer une demande d entrevue Consulter ou demander une demande d entrevue Consulter horaire d entrevue Enregistrer adresse de stage Tableau : Identification des besoins de l étudiant selon ses fonctions au cours du temps. En cas d échec aux examens l étudiant sera amené à avoir à nouveau les mêmes besoins qu en cours d année, comme par exemple : Consulter cours, Consulter exercices, Consulter corrigés, Consulter sujets d examens, Consulter notes, Consulter planning. On renseigne un certain nombre d éléments de l item besoins pour les acteurs étudiant et enseignant. Cet item peut s enrichir au cours du temps : b étudiant {s inscrire, s exercer, se former, rechercher emploi, rechercher stage} ; B enseignant {exercer, former, corriger, recenser, évaluer, budgétiser, déployer, planifier, se conformer aux textes officiels}. 188

191 B Préparer Créer = réponse? b Impact Adapter Évaluer rationaliser + copyright + reconnaissance Figure : Besoins des acteurs Fonctions Les enseignants et les étudiants ont des fonctions qui leur confèrent un rôle. L enseignant est amené à distribuer des devoirs, décrire des tâches à effectuer, évaluer, réceptionner des travaux. Enseignants et étudiants peuvent être amenés à utiliser des ressources : pour créer ou publier des pages web individuelles ou partagées, pour créer ou visionner des documents vidéo, pour prendre connaissance ou indiquer les objectifs visés de l auteur, pour lister des articles, des URL, des références de documents en rapport avec le thème traité, pour programmer un horaire d une mise en ligne d un document, pour historiser l état d avancement d un travail. Par les fonctions de communication, les acteurs peuvent : recourir à un calendrier privé ou partagé, discuter en privé ou de façon collective, utiliser un système de messagerie partagé ou global. Lors du processus de création de cours, les enseignants ont des fonctions d Organisation. Ils peuvent être amenés à : mettre à disposition sur le web des ressources pour les étudiants, proposer une présentation sur vidéo projecteur, partager avec des collègues une bibliothèque de documents, planifier les activités des étudiants en dehors des séances de cours, partager un agenda avec un groupe d étudiants, 189

192 gérer et suivre les stages étudiants. Les fonctions de supervision des enseignants permettent : de suivre et encadrer des projets étudiants, d évaluer les étudiants grâce à des QCM en ligne, de recueillir des travaux d étudiants sous format numérique, de réaliser une enquête auprès des étudiants, d animer un forum auprès des étudiants, de tutorer à distance des étudiants, de participer à un jury à distance. Nous spécifions un certain nombre d éléments de l item fonctions ainsi pour les étudiants et les enseignants : f étudiant {apprendre, créer, intégrer, vérifier} ; F enseignant {créer, enseigner, diriger, missionner, organiser, gérer, conseiller, superviser}. Cette liste n est pas close. rôles F spécifiques Distribuer des devoirs Décrire des tâches Réceptionner des travaux f spécifiques Objectifs visés de l auteur Historiser l état d avancement F communes Publier, lister, discuter messagerie, calendrier Figure : Fonctions des acteurs Activités Les activités des acteurs concernent leurs activités lors de l utilisation du système d information. Ils peuvent être amenés à rechercher, télécharger des dossiers, comprimer des fichiers, annoter des images ou du texte, indexer des documents, consulter des notes. Ils doivent parfois disposer d un certain degré d interactivité avec le système. Cette phase correspondra plus à l exploitation des informations. Il peut s agir d informations à déposer, d informations trouvées, d information à faire connaître à des publics ciblés. A côté de ses 190

193 tâches d intendance (gestion de l effectif, enregistrement des résultats), l enseignant est amené à participer à : la mise en forme des connaissances, la réalisation d un glossaire et d un index, la conception et la réalisation de la navigation, la réalisation de contrôles de connaissance. Ceci met en exergue de nouvelles pratiques quant aux activités des acteurs. Nous résumons les activités des étudiants et des enseignants dans l item activités: a étudiant {déposer, explorer, interroger, analyser, synthétiser, annoter} ; A enseignant {déposer, indexer, diffuser, explorer, interroger, analyser, synthétiser, annoter}. Ces activités interviennent lors de la création et la consultation des ressources d information. rôles A Annoter des images ou du texte Indexer des documents Publics ciblés Glossaire - index Navigation Déposer a Rechercher Télécharger des dossiers Comprimer des fichiers Consulter des notes Déposer Interactivité avec le SI Figure : Activités des acteurs Le processus de modélisation des acteurs fait ressortir des éléments utiles pour la suite de notre raisonnement La visualisation des données Pour aider à la représentation des différents items que nous venons de mettre en évidence c est-à-dire les besoins, les fonctions et les activités des types d utilisateurs nous proposons de les visualiser. Visualisons par un exemple des données autour de l acteur étudiant. La figure ci-dessous représente les fonctions de l étudiant par rapport au système d information selon le temps. 191

194 Inscription coordonnées Renseignements cours Etudiant Stage Emploi exercices procédures Fonction Année : début, milieu, fin Figure : Vue de l acteur étudiant Cette phase théorique, permet de proposer des vues du système d information par type d acteurs «étudiants», «responsable», «enseignant», «administratif», en tenant compte des quatre éléments qui sont ressortis après la classification et la catégorisation des acteurs pour représenter l utilisateur, c est-à-dire: type (T), fonctions (F), besoins (B) et activités (A). Le schéma ci-dessous [PEGUIRON et KISLIN et BOUAKA, 2003] propose des vues orientées acteurs élaborées à l aide du veilleur ou infomédiaire. Figure : Vues orientées acteurs tirées de l article en anglais pour SCI2003 Le veilleur, spécialiste de l information joue un rôle d intermédiaire entre le décideur et l information demandée. Le décideur peut être l étudiant, l administratif, l enseignant ou le responsable : pour résumer c est l utilisateur final qui décide si une information est en relation avec ses objectifs. L intermédiateur va exploiter les connaissances dont il dispose sur le décideur en traduisant le problème du décideur en indicateurs. Il aide aussi le décideur à découvrir les paramètres et à les vérifier. Le décideur est défini comme celui qui est apte à identifier et à poser le problème à résoudre en termes d enjeu, de risque ou de menace qui 192

195 pèse sur lui pour atteindre ses objectifs dans un contexte défini. Il utilise les indicateurs délivrés par l infomédiaire pour atteindre son objectif. Il extrait également des indicateurs, les informations nécessaires à la prise de décision. En conclusion nous avons pu faire émerger par la notion de méta information pour décrire les objets de nos recherches que ce soit des acteurs ou des ressources électroniques. Nous verrons comment articuler ces métas informations propres aux ressources électroniques et les métas données propres à l utilisateur dans un système d information d université via l outil entrepôt de données en vue d analyses dans une optique de prise de décision Résumé de la deuxième partie La deuxième partie aborde différents domaines : acteurs, enseignants, étudiants, système d'information, gestion, description, entrepôt de données, production, pédagogie, bases de connaissances, environnement, ressources documentaires, bibliothèques. Cette seconde partie restitue notre contribution pour répondre à la question posée au niveau de notre problématique, c'est-à-dire : comment intégrer la représentation des utilisateurs dans un système d'information stratégique universitaire? La modélisation des ressources documentaires et la modélisation des utilisateurs sont nos objets de recherche. Nous pensons que si nous prenons en compte un certain nombre d'éléments propres à l'utilisateur en amont de l'urbanisation d'un SI, nous travaillons à une meilleure satisfaction de l'usager. Nous sommes dans un environnement de formation où évoluent des acteurs, des systèmes de ressources documentaires, des systèmes de production d'information et des systèmes de recherche d'information. Le recours à des normes et des standards pour la conception d'un entrepôt de données de ressources documentaires dans un cadre pédagogique, intégrant la modélisation de l'utilisateur assurent l'interopérabilité des composants et la réutilisation de ressources. Les métas informations autour d'un texte permettent d'ajouter de la valeur à un système d'information. L'acteur est à la fois demandeur et consommateur, car il est placé dans différents contextes puisqu'il peut avoir plusieurs rôles : demandeur ou producteur d'informations. Les degrés d'exigence de l'utilisateur varient en fonction des informations. S'il est difficile d'imaginer quels besoins peut conduire tel acteur à récupérer de l'information lorsqu'il est dans une recherche via le web par exemple, il est plus facile par contre dans un contexte comme l'ent d'imaginer ses attentes pour l'orienter selon les cas, vers des 193

196 documents simplement analytiques, signalétiques, synthétiques ou au contraire vers des documents spécialisés. Nous pouvons mettre dans cette catégorie de multiples données relatives au contexte de production. L'association d'une description au contenu revient à créer des «métas données» relatives à ce contenu pour en faciliter la gestion et l'exploitation. L'établissement d'enseignement est le périmètre de référence de l'espace numérique de travail du point de vue de l'utilisateur. Les différentes briques du Système d'information Global sont accessibles à partir d'une authentification unique reposant sur le Ldap. Le processus d'intelligence économique permet d améliorer un système d information global. On constate que l'évolution des ressources documentaires est liée aux technologies de l'information. Les réflexions que nous menons sur l'utilisation des systèmes d'information aboutissent à enrichir la modélisation de l'utilisateur. Au niveau des acteurs, nous mettons en évidence un phénomène d'anticipation comportemental lors de l'utilisation d'un système d'information. Le processus du filtrage de l'information lors de la constitution de l'entrepôt de données s'opère par un filtrage thématique et dans la constitution des bases métiers par un filtrage fonctionnel. L'enrichissement des documents électroniques à l'aide de descripteurs concourt à un ciblage prospectif de l'information. Les métas données constituent un verrou en tant que passerelle entre des documents électroniques appartenant à la fois au niveau administratif et au niveau pédagogique. Dans une structure organisationnelle les connaissances sont un aboutissement de «savoir» et de «savoir-faire» amassés, analysés, capitalisés, partagés au sein d'un groupe afin d'optimiser, d'innover, de progresser. Dans un contexte d'apprentissage Organisationnel les acteurs réutilisent les informations acquises pour traiter des données nouvelles de l'environnement. A partir d une étude théorique d un système de classification des acteurs nous faisons émerger des besoins, des fonctions et des activités propres à des types d acteurs d un système d information. Nous proposons de représenter l utilisateur ainsi : RU = (T,B,F,A). Pour associer les besoins et les fonctions des utilisateurs par rapport au système d'information, nous menons des analyses des activités des utilisateurs sur le système d information. Après le résumé de la seconde partie sur la modélisation de l acteur d un SIS universitaire, nous pouvons aborder notre modèle RUBI 3 qui est le fruit des résultats de notre contribution. Nous mettrons notre modèle en perspective au niveau d une expérimentation, puis d une application. 194

197 Partie III : Le modèle RUBI 3 Amélioration et enrichissement du modèle par une expérimentation et une application Ne craignez pas d atteindre la perfection, vous n y arriverez jamais. [Salvador Dali] 195

198 196

199 Cette dernière partie permet la prolongation de notre étude sur la représentation des utilisateurs pour aboutir à un modèle formel RUBI 3. Nous débutons par un état de l art de l expérimentation qui repose sur l entrepôt de données. Nous nous appuyons sur cet outil pour exploiter notre modèle RUBI 3 propre à l utilisateur en tenant compte du contexte d un système d information stratégique universitaire. Ce processus expérimental permet d améliorer la modélisation d un système d information stratégique universitaire pour lequel nous identifions plusieurs niveaux à prendre en compte lors de sa conception. Nous verrons comment le modèle RUBI 3 permet de mettre en relation ressources documentaires et utilisateurs dans un espace numérique de travail partagé. Le modèle sert de point d ancrage pour une expérimentation en deux phases. Nous expérimentons des produits commerciaux et des produits alternatifs. Les produits commerciaux permettent de faire une check list des différentes étapes à respecter pour la constitution d un entrepôt de données résumées dans l acronyme RUBICUBE. Les produits alternatifs moins faciles d accès offrent de plus grandes perspectives dans la créativité et la maîtrise de l évolution de nos recherches. Les résultats de l expérimentation font émerger des notions qui favorisent la déclinaison de l acronyme RUBICUBE propre à la conception du système d information stratégique universitaire en tenant compte du contexte de l utilisateur et de ses spécificités. 197

200 198

201 Partie III - Chapitre 7 Etat de l art de l expérimentation 199

202 200

203 Partie III - Chapitre 7 Etat de l art de l expérimentation Pour être à même de proposer un modèle à partir de la représentation de l utilisateur, nous faisons appel à des notions propres à l entrepôt de données. Cette septième section fait l état de l art de l entrepôt de données. Pour faciliter la compréhension de cet outil nous illustrons nos propos par des exemples en milieu universitaire. Cet état de l art donne les pré-requis pour aborder la phase d expérimentation. Les méthodes de conception d un entrepôt de données sont encore très floues. On peut néanmoins dégager quelques pistes à suivre et quelques pièges à éviter. Selon [FRANCO, 1997b] quatre caractéristiques clés de l entrepôt de données ont des effets déterminants sur la démarche de conception d un projet de ce type. 1. Les évolutions technologiques La multiplicité des composants et leur utilisation en fonction du contexte facilite grandement la démarche de conception. On ne voit plus l entrepôt de données que comme une somme de briques logiques et logicielles. La solution au problème de l entreprise devient donc un puzzle de briques et non une adaptation du problème aux solutions technologiques. 2. Le lien implicite avec la stratégie de l entreprise Contrairement aux applications transactionnelles qui permettent d automatiser des processus existants, l entrepôt de données s exprime comme un besoin métier, qui fait intervenir toute la synergie de l entreprise. 3. Une logique d amélioration continue L entrepôt de données se doit d évoluer pour permettre à l entreprise de conserver sa réactivité, il nécessite donc des mises à jour imprévisibles et fréquentes. 4. Un niveau de maturité selon les entreprises Il correspond à la réaction d une entreprise vis à vis du décisionnel par rapport à ses objectifs internes. L entrepôt de données peut être considéré comme la poursuite d une vue décisionnelle, ou bien comme un nouveau domaine à explorer Architecture fonctionnelle d un entrepôt de données D après [FRANCO, 1997b], l architecture de l entrepôt de données comporte trois niveaux fonctionnels essentiels : le niveau acquisition des données, le niveau stockage des données et le niveau analyse de données. 201

204 Le niveau acquisition des données Partie III - Chapitre 7 Etat de l art de l expérimentation Cette phase se décompose en trois composantes distinctes : l extraction, la préparation et le chargement. 1. L extraction des données L extraction des données consiste à collecter les données utiles dans le système de production, pour déterminer quelles sont les nouvelles données à intégrer afin de ne pas surcharger le processus d extraction. Il faut également synchroniser les données entre elles pour permettre aux données de conserver leur relation à un moment t. Néanmoins cette phase d extraction amène quelques problèmes qu ils soient fonctionnels (synchronisation) ou techniques (environnement hétérogène). Pour extraire les données sources, plusieurs technologies sont utilisables : Les passerelles fournies par les éditeurs, principalement orientées données et pas processus de transformation. Les utilitaires de réplication : copie de données d une base vers une ou plusieurs autres bases de données. Ils sont utilisables uniquement dans des environnements homogènes. Les outils spécifiques d extraction : ils sont la solution mais bien souvent leurs prix sont élevés. Cette étape peut se révéler périlleuse en raison de l importance et de l hétérogénéité des sources de données. Il faut également des outils d aide à l extraction ou ETL 112 qui commencent à être bien diffusés sur le marché professionnel. Pour concevoir et alimenter un data warehouse il est périlleux de le faire sans schéma conceptuel. Alimenter un data warehouse, même en passant par un entrepôt temporaire, est dangereux car comme lors de l alimentation d une base de données, il faut s assurer de la résistance aux pannes aussi bien matérielles que logicielles. C est là tout l intérêt de faire reposer l entrepôt sur une structure physique relationnelle qui permettra d utiliser les caractéristiques sophistiquées des SGBDr tels que Sybase ou Oracle en termes de résistance aux pannes et de reprise du système décisionnel à un état cohérent. 2. La préparation des données La préparation correspond à la transformation des caractéristiques des données du système 112 ETL : Extract-Transform-Load 202

205 Partie III - Chapitre 7 Etat de l art de l expérimentation opérationnel dans la forme définie de l entrepôt de données. Cette préparation inclut la mise en correspondance des formats de données, le nettoyage, la transformation et l agrégation 113. Il s agit d épurer et transformer les données. Des données incorrectes peuvent entraîner des prises de décisions erronées. Ou encore ce n est pas la peine de mettre en place un système d information stratégique si les données ne sont pas fiables. Elles concernent : La redondance, c est à dire le fait qu une donnée soit dans plusieurs sources. Par exemple l adresse du client est à la fois dans la table «service», bien sûr, mais aussi, par souci de commodité d exploitation, dans la table «commande». Cela a pour conséquence d introduire des anomalies si le service change d adresse. Si on ne corrige pas l adresse dans la table «commande», alors les commandes non encore traitées, seront livrées à une adresse erronée. Ou bien encore si on la modifie, alors ce sont les anciennes commandes qui sont adressées à une adresse de livraison erronée. En résumé la redondance, bien plus que soulever un problème de place occupée, implique très vite une incohérence des informations. La synonymie est le fait, qu une même information, représentant le même concept, soit dans différentes sources. Le cas le plus classique dans une base de données est par exemple le numéro de client qui se nomme «nocli» dans la table «client» et «numclient» dans la table «commande». Notons que ce n est pas interdit par le modèle relationnel, puisque pour retrouver les commandes d un client il suffira de faire une équi jointure (au lieu d une jointure naturelle) entre les tables client et commande avec comme argument de jointure «nocli= numclient». L important est de nettoyer les données de façon à ce que la synonymie soit connue et non pas dissimulée. La duplication est un peu différente de la redondance. Il s agit la plupart du temps d une redondance calculée, c est-à-dire que l on sait que l information est répétée dans différentes sources de données souvent pour des raisons d usage, mais ce n est pas une anomalie en soi. 113 Agrégation : Action de calculer les valeurs associées aux positions parents des dimensions hiérarchiques. Cette agrégation peut être une somme, une moyenne, ou tout autre processus plus complexe comme la deuxième plus forte valeur. 203

206 Partie III - Chapitre 7 Etat de l art de l expérimentation Par exemple on souhaite conserver la trace de tous les clients dans un infocentre d une Université et en plus dans ses délocalisations. Le problème qui résulte de ces anomalies est de différentes natures : d une part ainsi que nous l avons dit, qui dit mauvaise qualité des données, dit non fiabilité. Comment alors prendre des décisions à partir de données non fiables? D autre part il est alors impossible de réutiliser ces données et donc de capitaliser la connaissance sous jacente. Il faudra donc disposer d outils sophistiqués pour vérifier la qualité des données et les transformer en vue de leur chargement. 3. Le chargement des données Le chargement représente la dernière phase d alimentation de l entrepôt de données. Il faut synchroniser les processus de chargement pour ne pas influer sur les applications. Il est également préférable d indexer les données après leur chargement dans l entrepôt de données plutôt qu à l insertion. Le transfert peut être multi formes suivant le type de la source de données. Cela peut concerner des transferts de fichiers, mais aussi de bases de données de production. Le niveau stockage des données Le composant de base du stockage est le Système de Gestion de Base de Données (SGBD). Toutefois, il doit répondre aux besoins du décisionnel : parallélisation des requêtes, regroupement ensembliste optimisé. Ici également intervient de manière très forte la structuration physique de l entrepôt de données, et ceci pour garantir des performances stables dans le temps, des indexations, des restructurations plus faciles. Un nouveau type de données fait maintenant face aux données contenues dans les SGBD : la gestion du contenu. La gestion de contenu concerne les vidéos, les images, les documents multimédia, les documents électroniques. Leur apport est de plus en plus important dans les processus décisionnels, et le SGBD doit être capable de gérer ce nouveau type d informations. Le niveau «collecte des données» intègre les mises à jour en provenance des différentes bases concernées de l entreprise et les stocke dans la base de données de l entrepôt en respectant son organisation par sujet. Le niveau analyse de données Ce composant reste d une manière globale à adapter aux groupes d utilisateurs. En effet, la réponse à l accès aux données ne peut venir que de la définition de la problématique des 204

207 Partie III - Chapitre 7 Etat de l art de l expérimentation utilisateurs et donc de l expression de leurs besoins. Il permet la formulation de requêtes afin de cibler sur les faits étudiés : l analyse en tendance : courbes d évolution des données, l aide à la prise de décision : extrapolation, la découverte de connaissances : règles, contraintes, tendances. Ce niveau est mis en œuvre à partir d outils réalisant des extractions par requêtes et des présentations graphiques variées. La figure résume les composants nécessaires à la réalisation de ces trois niveaux : Données externes Source de données BD légataires Source de données Données opérationnelles Source de données Extraction, transformation, intégration des données A C Q U I S I T I O N Entrepôt de données Présentation S T O C K A G E A N A L Y S E Composant décisionnel Composant décisionnel Composant décisionnel Figure : Architecture fonctionnelle d un entrepôt de données selon trois niveaux des données : acquisition, stockage, analyse A côté et en complément des entrepôts de données, qui nécessitent de puissantes machines afin de gérer de grandes bases de données contenant les données historisées, se développent des bases de données ciblées sur un ou deux sujets, appelées magasins de données (data mart 114 ). Ces petits entrepôts offrent des données aux décideurs de l entreprise pour l analyse, celles-ci pouvant provenir du data warehouse ou plus généralement de bases existantes. 114 Data mart : C est un entrepôt de données spécialisé métier, alimenté à partir du datawarehouse pour répondre aux besoins d'un service déterminé 205

208 Partie III - Chapitre 7 Etat de l art de l expérimentation Composants du middleware 115 Un problème [POTTIER, 2002] majeur de l approche est d assurer la cohérence des informations de l entrepôt avec celles des bases légataires dont elles sont issues. Il faut parfois être capable de conserver les données issues de chaque site participant pendant une période afin de rafraîchir la base de l entrepôt avec un ensemble de données cohérentes issues de tous les sites. Le collecteur de données peut même être amené à générer des requêtes d interrogation des bases participantes. Par exemple, pour recomposer les données d un utilisateur étudiant nouvellement inséré, on peut être conduit à interroger les autres bases de données afin de retrouver son cursus. Le middleware d extraction et de collecte doit détecter les mises à jour effectuées sur les bases légataires de l institution consolidées au niveau de l entrepôt. Pour cela, au niveau de chaque application fournissant des données à l entrepôt, doit être intégré un logiciel spécialisé capable de répercuter les mises à jour locales vers l entrepôt et de convertir les données dans un format plus ou moins commun. Un tel logiciel est appelé moniteur 116. Il doit être complété par un adaptateur 117 capable de transformer les mises à jour et les questions dans le modèle de l entrepôt, en général relationnel dans les réalisations actuelles. Les bases locales préexistent et sont souvent relationnelles, voire hiérarchiques ou réseaux. Ce peut même être des fichiers. Un des problèmes est de capturer les mises à jour et de générer les données nécessaires à la mise à jour de l entrepôt. Si le SGBD gérant la base légataire dispose d un mécanisme de déclencheurs (triggers 118 ), celui-ci peut être mis à profit pour générer l émission de la mise à jour vers l entrepôt. Sinon, il faut être capable d interroger périodiquement chaque base locale ou son journal afin de récupérer les mises à jour effectuées durant la dernière période. 115 Middleware (intergiciel en français) : C est un ensemble de logiciels ou de technologies informatiques qui servent d'intermédiaire entre les applications et le transport des données via le réseau. Ils offrent des services de haut niveau liés aux besoins de communication des applications (temps réel, sécurisation, sérialisation, transaction informatique, etc.). 116 Moniteur (Monitor en anglais) : Composant capable d'exporter au bon moment les données d'une source locale dans le bon modèle. 117 Adaptateur (Adapter ou Wrapper en anglais) : Composant capable de traduire les requêtes et les données depuis le modèle d'une source locale vers le modèle de l'entrepôt et vice versa. 118 Triggers (déclencheur en français) : Il s agit d'une procédure stockée associée à un événement pouvant intervenir sur une table. Elle est automatiquement exécutée quand la table associée est mise à jour par insertion, suppression ou modification. 206

209 Partie III - Chapitre 7 Etat de l art de l expérimentation Avant d être déversées dans l entrepôt, les données doivent être transformées, réorganisées et souvent filtrées. Il faut d ailleurs souvent intégrer les données en provenance de sources multiples : c est le rôle du médiateur. Le médiateur 119 doit aussi pouvoir traiter des requêtes, ceci afin d actualiser sur demande ou simplement de charger l entrepôt L architecture physique sous jacente à un data warehouse Les notions abordées dans les paragraphes précédents permettent d étudier dans un premier temps les différentes solutions retenues pour construire un entrepôt dans le cadre de la conception d un système d information stratégique, puis d aborder l architecture technique sous-jacente à un entrepôt de données. Comme le propose Odile Thiéry [THIERYa] on peut voir un système d information stratégique autour d un infocentre, c est que préconise IBM par exemple, inventeur de ce concept. Cette solution ne nous parait pas être la meilleure. En effet un infocentre est une vision centralisée des données qui ne concernent que les données de production et donc peu ou pas historisées par essence afin de ne pas ralentir le temps d exécution lors du traitement de ces données. Elle ne répond donc pas à l architecture préconisée ci avant. En revanche cette solution est séduisante car elle ne nécessite pas la construction d un nouveau système. Avantages Un seul système est nécessaire. Toutes les données sont disponibles. Inconvénients Problèmes de performances. Disponibilité des bases de production. Optimisation différente suivant le type de traitements. Figure : Infocentre L autre solution, radicalement opposée, est la construction d un nouveau système d information stratégique avec conception d un entrepôt. Bien sûr alors nous pourrons appliquer l architecture dans son ensemble, mais alors cela nécessite des moyens importants. 119 Médiateur (Mediator en anglais) : logiciel capable de donner une vision intégrée des différentes sources de données de l'institution sur demande par des requêtes. 207

210 Partie III - Chapitre 7 Etat de l art de l expérimentation En résumé pour construire un data warehouse, il y a deux solutions extrêmes : prendre une solution relationnelle calquée sur les bases de données de production, prendre une solution multidimensionnelle (outils OLAP) enfin essayer de combiner les deux. Avantages Base optimisée pour les traitements de pilotage. Démocratisation de l accès aux données. Inconvénients Nécessité de développer un second système complètement. Figure : Système d information stratégique organisé autour d un data warehouse L architecture technique sous jacente à un data warehouse Pour implémenter un entrepôt de données, plusieurs architectures sont possibles : l architecture réelle, l architecture virtuelle et l architecture remote. Architecture réelle C est l architecture qui est généralement retenue pour les systèmes décisionnels. Le stockage des données de l entrepôt de données est réalisé dans une base de données séparée du système de production. Cette base de données est alimentée par des extractions périodiques. Avant le chargement, les données subissent d abord : un processus d intégration, un processus de nettoyage, un processus de transformation. L avantage de cette solution est de disposer de données préparées pour les besoins de la décision et répondant bien aux objectifs de l entrepôt de données. La principale raison justifiant l architecture réelle est l inadaptation des données de production aux besoins des systèmes décisionnels. Les structures de données dans un système de production sont en effet complexes au niveau stockage et nécessitent une phase de programmation pour y accéder. Dans un contexte d utilisation décisionnelle, les données doivent être compréhensibles par l utilisateur. 208

211 Partie III - Chapitre 7 Etat de l art de l expérimentation Il faut donc transformer tous les codes en données lisibles. L entrepôt de données doit intégrer les données les unes avec les autres afin d assurer une cohérence sémantique globale. Les données sont évolutives. Il n y a pas de consolidation possible sur une période du fait que la donnée évolue au fur et à mesure des transactions. C est ici qu intervient la définition de la donnée en elle-même, à savoir les métas données 120. La signification de ces données peut-être ambiguë. Elle peut dépendre de l application qui l utilise. La donnée peut poser un problème de cohérence, courant dans les systèmes de production, qui doit systématiquement être traité afin de minimiser les redondances d informations dans l entrepôt de données et d unifier la sémantique au niveau de l entreprise. Architecture virtuelle Dans une architecture virtuelle, les données de l entrepôt résident dans le système de production. Elles sont rendues lisibles par des produits middleware ou par des passerelles. Il n y a pas, dans cette architecture, de coût de stockage supplémentaire et l accès se fait en temps réel. Cependant, les nombreux désavantages de ce type d architecture en empêchent fréquemment le choix. Les données ne sont pas préparées. Les accès décisionnels risquent de perturber les performances du système de production d autant plus que les processus de transformation et d intégration sont ici forcément liés au processus d accès. Enfin, pour le cas où la gestion d historique n est pas prévue dans le système de production, il est impensable de l y intégrer. Architecture remote data access L architecture remote est une combinaison des deux architectures décrites précédemment. L objectif est d implémenter physiquement les niveaux agrégés, niveaux de données les plus souvent utilisées, afin d en faciliter l accès, de garder le niveau de détail dans les systèmes de production en y donnant accès par le biais des middlewares ou des passerelles. Cette architecture est également très rarement utilisée Comment modéliser un entrepôt de données La modélisation par sujet La modélisation «naturelle» d un data warehouse en informatique de gestion est la modélisation relationnelle et donc normalisée. 120 Les métas données sont des données qui décrivent des données 209

212 Partie III - Chapitre 7 Etat de l art de l expérimentation Au niveau de l entrepôt, pour pouvoir exploiter facilement les données, le concepteur doit réaliser une classification par sujet fonctionnel plutôt que par application. Pour cela, une modélisation relationnelle est souvent utilisée, chaque sujet correspondant à une table gérée par l entrepôt. La définition des tables de l entrepôt nécessite d isoler les données stratégiques, de déterminer les informations de détails nécessaires et les résumés à conserver. Ces derniers sont souvent calculés par des requêtes comportant des fonctions d agrégats. Un entrepôt de données est généralement fondé sur un SGBD relationnel. Les tables gérées par un entrepôt sont donc des vues concrètes «napshot» dérivées à partir des données des bases légataires. Dans le cas où les données sont issues de bases relationnelles, les techniques de gestion de copies multiples peuvent avantageusement être mises en œuvre pour générer les données de l entrepôt. Une contrainte est due au fait que l intégration est souvent nécessaire à partir de sources hétérogènes. Des transformations de formats, de modèles, de noms ou d unités peuvent être nécessaires afin de composer des données cohérentes pour l entrepôt. applications sujets Gestion administratrative étudiant Gestion RH enseignant Gestion documentation responsable Gestion pédagogique BD de l ED Figure : Modélisation par sujet Par le niveau d agrégation des données nous pouvons avoir des axes différents d analyse. Par exemple en plus du temps on veut examiner aussi le montant des dépenses par document, type de document, domaine de document. Le volume de données final est gigantesque. Il avoisine de fait très vite le giga voire le tera octet. Autant dire qu il n est pas facile de gérer de tels volumes surtout ensuite pour avoir des 210

213 Partie III - Chapitre 7 Etat de l art de l expérimentation temps de réponse convenables lors de l interrogation de l entrepôt. Ceci conduit naturellement à un éclatement des données sur plusieurs tables ainsi que le représente le modèle physique de données (MPD) de la figure : Par exemple pour une gestion des commandes d ouvrages : nous aurons quatre entités ou tables en l occurrence : les tables «service, document, commande et ligne_commande» est passée par concerne concerne Figure : Le modèle physique de données d une gestion de commandes de documents Or ce genre de structure s il est parfaitement correct au point de vue théorique pose quelques problèmes lors de son exploitation. Il s agit en fait du même objet «les commandes d un service» qui par nécessité de respect de la troisième forme normale est éclaté sur plusieurs tables. Lorsqu il s agit de données de production il est indispensable de respecter ces critères sinon très vite la base de donnée, par le biais de redondances, donc d incohérences futures, sera inconsistante ; autant, dans le cadre de données historisées donc uniquement interrogeables, l urgence n est plus à la normalisation mais à l exploitation facile. Si on représente à l aide du modèle relationnel ce type de données cela comporte plusieurs inconvénients : il faut connaître le schéma pour interroger de telles bases, il faut être expert en SQL et pour finir étant donné que les résultats ne sont pas pré agrégés il faudra au moment du lancement de la requête réaliser les calculs. Les temps de réponse seront ainsi très longs. Il a fallu donc proposer d autres structures. 211

214 7.2.2 La modélisation en étoile Partie III - Chapitre 7 Etat de l art de l expérimentation A chaque table correspond une dimension ou axe d analyse. Chaque table de faits rassemble les données se rapportant à chaque dimension, soit ici l équivalent d une association «à quatre pattes» au sens de Merise. Le schéma en étoile représente une table de faits connectée à un ensemble de tables de dimensions. Cette déclinaison nous permet de dessiner la granularité des dimensions : temps, acteur (étudiant), géographie. lib_temps date_du_chargement jour jour_semaine mois trimestre année lib_profil_etudiant code_pru date_de_chargement libelle_profil_etudiant mesures Table de faits étudiants date_du_chargement code_etudiant code_profil_etudiant lib_pays nb_heures_eq_td nb_heures_eq_tp Identite_etudiant code-etudiant date_de_chargement numero-etudiant nom prenom code_composante lib_pays date_de_chargement pays libelle_pays groupe_pays libelle_groupe_pays europe libelle_europe Figure : Schéma en étoile d une table de faits étudiants La modélisation en flocon Quand cette structure devient trop volumineuse, est préconisée une modélisation en flocon. Les dimensions sont structurées en sous dimensions et, donc, chaque dimension est organisée en hiérarchie de détail. Le schéma en flocon de neige est un raffinement du schéma en étoile où certaines tables de dimensions sont normalisées (donc décomposées). L un des éléments (composante) de la table acteur (étudiant) est décomposé. 212

215 Partie III - Chapitre 7 Etat de l art de l expérimentation lib_temps date_du_chargement jour jour_semaine mois trimestre année lib_profil_etudiant code_pru date_de_chargement libelle_profil_etudiant mesures Table de faits étudiants date_du_chargement code_etudiant code_profil_etudiant lib_pays nb_heures_eq_td nb_heures_eq_tp Identite_etudiant code-etudiant date_de_chargement numero-etudiant nom prenom code_composante lib_pays date_de_chargement pays libelle_pays groupe_pays libelle_groupe_pays europe libelle_europe lib_composante code_composante date_de_chargement libelle_composante Figure : Schéma en flocon de neige La modélisation en constellation de faits La constellation de faits permet de représenter plusieurs tables de faits partageant quelques tables de dimension. Les tables de faits (étudiants) et (enseignants) peuvent être mises en relation par la dimension temps et géographie. lib_temps date_du_chargement jour jour_semaine mois trimestre année lib_profil_etudiant code_pru date_de_chargement libelle_profil_etudiant mesures Table de faits étudiants date_du_chargement code_etudiant code_profil_etudiant lib_pays nb_heures_eq_td nb_heures_eq_tp Identite_etudiant code-etudiant date_de_chargement numero-etudiant nom Table de faits enseignants prenom code_composante date_du_chargement lib_pays code_pers code_profil_pers code_composante date_de_chargement pays libelle_pays lib_composante groupe_pays libelle_groupe_pays date_de_chargement europe code_composante libelle_europe libelle_composante lib_pays Figure : Constellation de faits En fait la structure de l entrepôt peut, de par l exploitation que l on souhaite faire, être fort différente de celle de la base de données de production. 213

216 Partie III - Chapitre 7 Etat de l art de l expérimentation Nous verrons que des données externes peuvent être rajoutées à l entrepôt. Ceci nous conduit au concept de base de données multidimensionnelle, qui peut être exploitée sous différentes vues Analyse multidimensionnelle Le tableau de bord fait partie intégrante du management. Le tableau de bord permet une bonne visualisation des processus, du fonctionnement et des actions d un service. Quelles informations contiennent un tableau de bord? Dans la définition des critères et indicateurs le constituant, le tableau de bord doit être construit en prenant en compte les objectifs poursuivis et les exigences des utilisateurs. Son intérêt réside dans l appui qu il apporte à la prise de décision. Les indicateurs sont généralement placés au croisement d une ligne et d une colonne, représentant le croisement de deux entités. Un indicateur est un nombre, une somme, un minimum, ou un maximum, donc toujours un nombre. Cela correspond bien à nos cases de tableau de bord. Voici un exemple d indicateurs pour quantifier les types d enseignant selon l UFR Mathématiques et informatique : UFR enseignant du second degré professeur non enseignant Mathématiques et Informatique Nbre(X) Nbre(Y) Nbre(Z) Figure : Exemple d un tableau de bord D après le paragraphe 7.2 «Comment modéliser un entrepôt de données» une solution consiste à utiliser la modélisation dimensionnelle, qui dérive des concepts des bases de données multidimensionnelles dites OLAP. L avantage de ce type de modélisation est avant tout d être indépendant du type de technologie utilisé. Le but de cette méthode est de faire ressortir des besoins en indicateurs de performance sur les données et ainsi de permettre de définir des dimensions (exemple le temps ou le découpage géographique). Le processus OLAP 121 permet aux décideurs finals, d avoir accès rapidement et de manière interactive à une information pertinente présentée sous des angles divers et multiples, selon leurs besoins particuliers. Le concept OLAP serait apparu pour la première fois en 1993 dans un livre blanc réalisé par E.F. Codd, l un des concepteurs des bases de données relationnelles, à la demande d Arbor Software (Hyperion). Les applications OLAP sont intimement associées aux entrepôts de données ou datawarehouse - c est-à-dire les bases qui, au sein 121 OLAP : Online Analytical Processing. 214

217 Partie III - Chapitre 7 Etat de l art de l expérimentation d une plate-forme de business intelligence, se chargent de consolider (par le biais d outils d intégration de données notamment) l ensemble des informations métier d une activité, en vue d en permettre ensuite l analyse. Au sein d une solution de business intelligence, OLAP fait donc figure de logique applicative, couche prenant en charge requêtes et traitement métier. Les requêtes Structured Query Language (SQL) ne pourraient pas prétendre remplacer OLAP. A l origine, les premiers outils décisionnels ont cherché à exploiter les possibilités de requêtage des bases relationnelles. Cependant, cette voie a très vite montré ses limites. En effet, les infocentres traditionnels, OnLine Transactional Processing (OLTP) - à 2 dimensions, ne se prêtent guère aux requêtes croisées ou multidimensionnelles. Rappelons que le terme OLAP englobe à la fois les architectures MOLAP 122 et ROLAP 123. MOLAP 124 : multidimensionnal OLAP. Ces outils reposent sur une information pré packagée et fortement structurée, La pré agrégation étant systématique les temps de réponse sont très brefs. On dispose de deux fonctions prédéfinies de parcours de données : «drill down 125» qui permet de faire un zoom sur les données (par exemple analyser le CA à l année, puis au mois, à la semaine etc.) et «slice and dice» qui permet un changement d axe (par exemple analyse le CA suivant les différents types de produits après avoir analysé selon l axe du temps). En revanche le volume des données peut devenir pharaonique (10 giga octets à multiplier par 100 voire 1000 si on veut pré agréger les résultats à tout niveau de dimension), tout besoin doit être pré modélisé (sinon il faudra re-générer l hypercube) et enfin il faut développer un système en plus du SI classique de l entreprise et donc disposer de moyens conséquents. ROLAP 126 : relational OLAP. L information est dans une base de données relationnelle et à l aide d un dictionnaire le système construit une structure logique multidimensionnelle. Le temps de réponse est forcément plus long mais la solution est plus souple. 122 MOLAP : Multidimensional On Line Analytical Processing. Traitement analytique multidimensionnel en ligne. Dans l'univers du datawarehousing, technique de modélisation et de stockage des données consistant notamment à distinguer les faits à analyser (indicateurs, métriques,...) et les différents axes d'analyse encore appelés «dimensions». Ces structures multidimensionnelles sont appelées également hyper cubes («cubes» à plusieurs dimensions). 123 ROLAP : Relational On Line Analytical Processing. Traitement analytique relationnel en ligne. Dans l'univers du datawarehousing, technique de modélisation et de stockage des données fondée sur une structure relationnelle. 124 MOLAP : Multidimentional On-Line Analytical Processing. 125 drill down : Forer vers le bas. Aller du général au particulier dans une recherche d'information dans une base de données multidimensionnelle. 126 ROLAP : Relational On-Line Analytical Processing 215

218 Partie III - Chapitre 7 Etat de l art de l expérimentation Passerelle vers le SGBD pour l accès aux informations détaillées Les données stockées alimentent le cube en dynamique Data warehouse Data warehouse Les données sont stockées dans un cube multidimensionnel Structure logique d accès multidimensionnel Modèle multidimensionnel Olap (Molap) Modèle relationnel Olap (Rolap) Figure : Principes MOLAP et ROLAP La solution ROLAP est souvent retenue à ce jour pour des entreprises ne désirant pas investir lourdement dans les SIS. On peut représenter de façon graphique des informations contenues dans une base de données, sous la forme d un cube à plusieurs dimensions, lequel cube permet d analyser ces données sous différents angles, grâce à l organisation de celles-ci en axes d analyses et en variables à analyser. Le but est bien de répondre au mieux aux utilisateurs. Avant de pouvoir personnaliser les réponses du système, il est nécessaire de connaître les besoins des utilisateurs, leurs rôles et leurs comportements. Dans notre optique, le passage d un SI à un SIS ou SID se fait par l intégration des comportements des utilisateurs Les bases de données multidimensionnelles Une structure multidimensionnelle caractérise une base de données dédiée au décisionnel stockant les données sous forme d un tableau multidimensionnel. C est un moyen d analyse de la performance selon différents axes qui permet : de définir des indicateurs correspondant à des résultats agrégés de différentes manières, d associer les indicateurs à des axes ou dimensions d analyse. On peut ainsi analyser le nombre d étudiants inscrits par exemple selon le temps, le lieu ou les services, de construire des représentations graphiques pertinentes pour aider à la prise de décisions. Notons que les tableurs permettent de répondre en partie à ces besoins, mais en partie seulement. En effets autant par exemple Excel permet de bonnes représentations graphiques, autant cet outil, d une part se limite à des tableaux à deux dimensions, d autre part ne permet 216

219 Partie III - Chapitre 7 Etat de l art de l expérimentation que des analyses de données statistiques simples et en aucun cas une fouille de données digne de ce nom. Voyons quelques définitions : Dimension Ou axe d analyse, c est un centre d intérêt pour le décideur (ou un indicateur). Par exemple le temps, les lieux ou les services. Hiérarchie de dimension Arbre de niveaux intéressant le décideur. Par exemple pour l axe temps : année, trimestre, mois Mesure ou fait C est une grandeur caractérisant un domaine de la base de données multidimensionnelle par rapport aux dimensions. Ou encore il s agit d une donnée «quantitative» attachée au niveau le plus bas d une dimension. Notons que nous parlons bien de donnée quantitative et non qualitative. Les SIS actuels n intègrent pas ou peu la notion de donnée qualitative telle que «quel domaine de recherche en pointe» sauf au moment du reporting où un outil tel que COGNOS permet de spécifier des intervalles de définition de variable. Ainsi, dans cet exemple, on pourra dire que tel domaine de recherche est en émergence par identification d un nouveau vocabulaire utilisé au-dessus d un seuil déterminé. La figure représente, sur un exemple simple de gestion de services, à la fois la notion de dimensions, celle de hiérarchie de dimension et deux mesures (quantité acquisitions et coût). Figure : Dimensions et mesures Notons qu une hiérarchie de dimension n est pas forcément aussi simple que le présente cette figure. Il faut le voir plutôt comme une arborescence où seront calculés et stockés les agrégats par rapport aux mesures choisies. Ainsi si nous souhaitions avoir pour chaque site délocalisé les quantités consultées selon l axe des lieux, il suffirait de rajouter une feuille dans la dimension «lieu» sous «documentation» qui serait «site délocalisé». 217

220 Partie III - Chapitre 7 Etat de l art de l expérimentation Hypercube Le lien entre dimension et mesure est réalisé par la notion d hypercube. Un hypercube est une structure permettant de croiser des dimensions pour stocker des variables. Un hypercube appelé datacube en anglais est un cube multidimensionnel. On peut représenter de façon graphique des informations contenues dans une base de données, sous la forme d un cube à plusieurs dimensions, lequel cube permet d analyser ces données sous différents angles, grâce à l organisation de celles-ci en axes d analyses et en variables à analyser. Le cube permet de visualiser des mesures extraites d un data warehouse, selon 3 dimensions dont l une est souvent le temps, avec possibilité de coupes et projections selon 2 dimensions. La figure présente un exemple sous les deux formes relationnelles et multidimensionnelles : Enrgt Champs Consultant Martin Martin Martin Dupont Dupont Service Cours Doc@ Projets BqD CD Table des ventes Date Jan04 Jan05 Jan06 Fév04 Fév05 Qté Consultant Martin Dupont Durand Cours Service C D Projets Fév0 Jan05 5 Temps Quantité Vue relationnelle Vue multidimensionnelle Figure : Exemple de vision relationnelle et multidimensionnelle d un hypercube Lorsqu une coupe du datacube a été sélectionnée, il est possible de l étendre en précisant une dimension. Par exemple, un gestionnaire sélectionnera l année 2004 et désirera étudier l évolution des étudiants inscrits par mois. Cette opération est appelée «drill down». L inverse est le «drill up». Le cube multidimensionnel propose une présentation synthétique des données permettant rapidement d obtenir des courbes, camemberts, etc. Il facilite la sélection selon un axe, le passage à un niveau plus fin de détails, et les calculs d agrégation (somme, moyenne, écart, min, max). Le choix d une structure de données adaptée pour stocker le cube et ses agrégats reste un problème ouvert. Il serait notamment souhaitable d éviter les recalculs coûteux d agrégats en concrétisant des vues appropriées. 218

221 Partie III - Chapitre 7 Etat de l art de l expérimentation La plupart du temps les SGBD sous jacents à ce types d outils étant relationnels, il faudra bien prévoir une implantation de ce type. Cependant quels sont les avantages d une modélisation multidimensionnelle quelle que soit la représentation physique ultérieure? Si la structure de l entrepôt est relationnelle comme nous l avons déjà dit, alors il faut à la fois être expert sur le schéma de l entrepôt mais aussi être expert en SQL. D autre part aucun résultat n est pré calculé, ce que nous avons appelé les «agrégats». Il s en suit un temps de réponse aux interrogations sur l entrepôt qui peut se révéler rédhibitoire. Le recours aux bases métiers ou datamarts permettent d améliorer l analyse multidimensionnelle Construction des référentiels lors de l alimentation d un data warehouse Les composants d un système décisionnel (SIS) Il se compose d un data warehouse, de bases de données multidimensionnelles ou hypercubes et d un ensemble d outils permettant l alimentation du data warehouse, son interrogation et la production de rapports, l extraction intelligente des données par techniques de data mining enfin l analyse décisionnelle pour réaliser le pilotage de l organisation. Alimenter un data warehouse consiste à migrer et à préparer les données issues des bases de données de production en vue de leur analyse dans un environnement décisionnel. Les outils d alimentation ou ETL 127 extraient, transforment, vérifient les données issues des bases de production et les stockent dans le data warehouse tout en construisant le dictionnaire de données ou référentiel ou encore l ensemble des métas données. La figure montre les différentes étapes de l alimentation d un data warehouse. Il s agit de rechercher et d identifier des données et de contrôler leur qualité. La découverte se résume par l extraction des données, la transformation et l épuration des données, le transfert et le chargement des données. 127 ETL : Extract-Transform-Load 219

222 Partie III - Chapitre 7 Etat de l art de l expérimentation Méta-données Référentiel Sources externes BDs opérationnelles Extraire Nettoyer Transformer Charger Rafraîchir Entrepôt de données Data mining Serveur OLAP Servir à la prise de décision Bases métiers Bases métiers Serveur OLAP Figure : Système d alimentation d un data warehouse La découverte des données permet d élire les meilleurs fichiers, sachant que souvent les données pour une même classe d objets (par exemple les utilisateurs) peuvent être réparties de façon redondante ou disjointe sur différents fichiers ou tables. C est ce que l on appelle en base de données la fusion des vues externes sur les données. Il faut bien sûr en vérifier la qualité et découvrir les informations sur les données à stocker dans le référentiel. Ceci est tout à fait analogue à ce que construit en termes de dictionnaire de données (DD) l outil Power AMC lorsque l utilisateur décrit un modèle conceptuel de données (MCD) Merise. En effet cet outil construit automatiquement un référentiel qui contient la liste des entités et des associations ainsi que leurs propriétés. Ce dictionnaire de données peut être complété ensuite par l utilisateur afin de lui donner un réel caractère de référentiel de l application. C est ce que l on appelle les métas données ou encore données sur les données dans un entrepôt. Les métas données sont construites au fur et à mesure et en accord avec les données de l entrepôt. L entrepôt donne naissance à des vues (bases) métiers ou data marts qui représentent les données destinées à une fonction particulière de l institution. Par différentes techniques et en particulier de data mining peuvent être construites les bases de données multidimensionnelles ou hypercubes ou encore classiquement nommées comme ici des bases OLAP (pour On Line Analatycal Processing). Différents types d outils reposant sur du data mining permettent une extraction de données et leur présentation dans des rapports. Le data mining permet de découvrir des connaissances fort utiles à la prise de décision. 220

223 7.4.2 Définition de la fouille de données Partie III - Chapitre 7 Etat de l art de l expérimentation La fouille de données ou le data mining [GARADARIN, 2005] est l ensemble des techniques permettant d extraire des informations d une base de données historisées par raisonnement statistique afin de décrire le comportement actuel et / ou de prédire le comportement futur d un procédé. Un SIS permettant la fouille de données est en fait pour nous l ensemble des outils ayant pour objet d extraire des connaissances à partir des données de l entreprise ou de l institution. Ils sont destinés aux décideurs et utilisateurs métiers. Cela permet par exemple de dégager des profils des utilisateurs et de leurs besoins types afin de prévoir les services à mettre à leur disposition. Il s agit d anticiper le comportement des utilisateurs et de prévoir les besoins futurs. Cette définition repose sur le concept de différentiation donnée / connaissance. Une donnée décrit des exemples ou des événements précis (exemple le détail des sessions des utilisateurs). La connaissance décrit une catégorie abstraite (classification des services d où déduction des activités). Les outils de découverte de connaissance ou Data Mining Ces outils permettent de découvrir automatiquement des faits et données pertinents. Ils interviennent à deux niveaux de filtrage. D une part en amont pour construire l entrepôt à partir des différentes sources de données. En aval pour construire les bases métiers en fonction du modèle dont on dispose sur l acteur et son métier. Les outils traitent le décisionnel d une manière générale, alliant la préparation et l attaque des sources de données avec des fonctions de reporting et de Data Mining. Les outils d exploitation d un data warehouse peuvent être classés en deux catégories: outils d aide à la décision, permettant d interroger et d analyser l évolution des données, outils de data mining, permettant de comprendre les relations entre les données Le référentiel ou métas données Nous l avons dit un data warehouse repose sur un dictionnaire de données particulier : le référentiel de métas données. 221

224 Partie III - Chapitre 7 Etat de l art de l expérimentation Les métas données Les métas données sont des informations sur les données indispensables à une exploitation efficace d un data warehouse. Parallèlement à Power AMC, un SGBDr tel que Sybase construit un ensemble de tables systèmes qui contiennent, aussi bien la description de l implantation des schémas conceptuels (liste des tables avec leurs champs et caractéristiques), que des informations sur les utilisateurs et leurs droits d accès, et, même, stocke du code Transact SQL comme la définition des règles (rules 128 ou contraintes d intégrité) et des triggers 129 ainsi que des événements déclencheurs. Les métas données peuvent être de différents types : Les métas données des systèmes sources donnent les informations sur les structures de données initiales des bases de données de production, Les métas données du SGBD (ou des SGBD) qui sont en fait les tables systèmes décrites ci dessus, Les métas données des outils frontaux, c est-à-dire en fait des interfaces utilisateurs, Enfin les métas données des données de l entrepôt. Nous nous focaliserons ici sur ces dernières. Ces métas données permettent de répondre aux questions suivantes : Que représente cette donnée ou encore quelle est sa sémantique? par exemple que représente le budget d un service, ou même qu est-ce un service pour l université? D où vient la donnée? Qui l a créée, qui la met à jour ou encore quelle est son origine? Comment est-elle calculée? Ou encore quelle est sa règle de calcul ou de gestion? par exemple comment sont calculées les recettes d un service? Quel est son format ou encore son mode de stockage? Par exemple avec quelle unité calcule-t-on le budget? En francs, euros, dollars? Avec quelle fréquence est-elle mise à jour ou encore quelle en est son utilisation? et par quel(s) programme(s)? Enfin qui est responsable de cette donnée ou encore qui en est son administrateur? C est évidemment fondamental dans le cas d une conception de data warehouse multi sources. 128 rules : règles 129 triggers : déclenchements 222

225 Partie III - Chapitre 7 Etat de l art de l expérimentation Remarquons que cette fonction d administrateur de données fondamental pour les bases de données de production l est peut être encore plus ici. Une nouvelle fonction est née pour les systèmes décisionnels : la fonction de «data provider 130» qui recouvre l administration mais aussi la production des données sous forme de rapports. La figure exprime le rôle des métas données dans un entrepôt et leurs caractéristiques. Les métas données se doivent d être accessibles y compris au travers d interfaces web, évolutives et réactives. Et c est l outil sous jacent au référentiel qui doit le permettre. ACCESSIBILITE Utilisateurs Usages (aide, interface) DIFFUSION Travail via le web EVOLUTIVITE + d administration - de maintenance (applications) AUTONOMIE REACTIVITE Utilisateurs (navigation, indicateurs, graphique, reporting, analyse) Figure : Caractéristiques des métas données En fait il y a deux types principaux de métas données représentés sur la figure pour un data warehouse : des métas données structurelles écrivent la structure et le contenu de l entrepôt (son schéma conceptuel) et des métas données d accessibilité qui représentent le lien dynamique entre l entrepôt et les utilisateurs. Dans les référentiels actuels ce sont surtout les métas données d accessibilité qui sont détaillées, les métas données structurelles ayant fait l objet de nombreuses recherches [POTTIER, 2002]. 130 data provider : fournisseur de données 223

226 Partie III - Chapitre 7 Etat de l art de l expérimentation Système de Pilotage Reportings Restitution s E.D. Système multidimentionnel Analystes Métadonnées structurelles Métadonnées d accessibilité Figure : Typologie des métas données d un entrepôt Le référentiel Un référentiel de bases de données est un ensemble valide et cohérent de modèles permettant d en garantir la cohérence horizontale (c est à dire sur l ensemble des applications) et verticale (c est à dire sur les trois niveaux de conception habituellement admis : conceptuel, logique et physique). Un référentiel de data warehouse est un référentiel de base de données gérant aussi les liens avec les bases de données de production et les règles explicitant l agrégation et l historisation des données. Il complète en fait les référentiels des bases de données de production ou des différentes sources de données. Il doit assurer, en regard à ce qui a été dit sur la nécessité de disposer de données de qualité et par extension de métas données de qualité : La fiabilité de l information, La cohérence et l indépendance des données par rapport aux différentes sources de données, La consolidation de l information. C est à dire en définir le périmètre. Par exemple définir ce que l on entend par services dans les universités et leurs sites. Ce type d information est fondamental car il va conduire aux critères d agrégation des données, La gestion des historiques, idem cela va donner des indications d agrégation des données et des résultats calculés, La gestion de la réplication et de la distribution. La réplication est une redondance calculée ou connue. Exploration de données 224

227 Partie III - Chapitre 7 Etat de l art de l expérimentation 7.5. Les outils Nous abordons les outils d interrogation et de reporting, les outils d analyse ou EIS et les outils de fouille de données. Les outils d interrogation et de reporting Ces outils permettent une recherche d information dans des bases de données diverses et pas forcément d ailleurs un entrepôt. Ils reposent sur l utilisation d objets métiers conçus pour et avec l aide des utilisateurs finals. Un exemple : objet métier commande qui comprendra les informations sur la commande et ses lignes bien sûr mais aussi des informations sur le client et le produit. L accès se fait à travers une interface conviviale. L objectif est de permettre l accès au SIS à tous les acteurs, décideurs, concepteurs et chefs de projet informatique et aussi utilisateurs lambda. Les outils d analyse ou EIS Un EIS 131 est un logiciel permettant la construction interactive et progressive de tableaux de bord pour décideurs à partir d une vue multidimensionnelle des données stockées dans un hypercube. Un tableau de bord est un ensemble d indicateurs ou encore un tableau de synthèse qui représente une situation d Organisation à un instant donné. Avant les EIS les tableurs tels qu Excel jouaient ce rôle d aide à la décision par les rapports que l on pouvait en tirer. Il faut que ce type d outil ne nécessite aucun apprentissage de langage de programmation. Les problèmes traités par la fouille de données Nous prenons des exemples dans le secteur universitaire. Quatre grandes classes de problèmes sont abordées par ces techniques de la fouille de données comme l expliquent [BAZSALICZA et NAIM, 2001] ; [LEFEBURE et VENTURI, 2001] : Segmentation : segmenter le comportement des lecteurs par exemple. Il s agit de déterminer les grandes classes de comportement d emprunt et de rechercher des groupes homogènes dans un ensemble d individus. Association : relier les préférences des utilisateurs d un centre de documentation entre elles. Par exemple une règle classique de déduction est «si utilisation de salle informatique alors emprunt livre d informatique», et donc il serait bon de disposer le rayon des livres informatiques à proximité de la salle multimédia. 131 EIS : Executive Information System 225

228 Partie III - Chapitre 7 Etat de l art de l expérimentation Classification : relier les caractéristiques d un utilisateur à son comportement d utilisation des services. Il s agit de prévoir une caractéristique d un individu à partir des caractéristiques du groupe auquel il appartient. Estimation : évaluer les besoins d un utilisateur en fonction de ses caractéristiques. En résumé la fouille de données c est, dans le cadre d une mission donnée, analyser les données détaillées pertinentes dont on dispose pour en déduire les actions les plus rationnelles, cela pour limiter les prises de risque, favoriser l anticipation et faire preuve de réactivité Les solutions commerciales Les outils décisionnels doivent faciliter l interrogation des données de l entrepôt à partir d un poste client. Des guides et aides à la formulation des requêtes sont là souhaitables. L analyse des résultats des requêtes doit pouvoir être effectuée dans les termes familiers à l utilisateur final. A partir d interfaces graphiques d usage simple, il faut être capable de générer des analyses multidimensionnelles et des rapports illustrés de graphiques. Ces rapports doivent pouvoir être intégrés dans des documents. Il existe de nombreux produits pour l analyse interactive de données utilisables autour des entrepôts. Ils concernent différents secteurs. Nous proposons ici un inventaire valable à un instant t et vite obsolète compte tenu de l évolution des produits. Citons par exemple : Actuate, éditeur leader de solutions de reporting d entreprise, Informatica, principal fournisseur de solutions d intégration de données et de business intelligence, Express racheté par Oracle, MetaCube racheté par Informix, Des logiciels dérivés des grands SGBD relationnels et destinés au data warehouse : EXPRESS (Oracle), IQ (Sybase), Des logiciels dérivés des logiciels statistiques : SAS et son outil sophistiqué de data mining Enterprise Miner, Des logiciels du monde Microsoft très ouvert : Business Object, Cognos, Hyperion (racheté par Microsoft), 226

229 Partie III - Chapitre 7 Etat de l art de l expérimentation Plus nouveau : les ERP 132 intégrant un module AID, Suites orientées Business Intelligence et Knowledge Management : Sagent, Showcase,Volantia, DB2 OLAP, Olap Cube, SQL Server OLAP, Impromptu, PowerPlay, Brio, Cognos ou Teradata. Les tableaux récapitulatifs en annexes [A3] listent de façon non exhaustive des outils décisionnels qui proposent des outils d ETL, de transformation des données, de requêteur Olap, d explorateur de cubes OLAP, de moteur R-Olap, de moteur M-OLAP, Outils de datamining, des outils d analyse prédictives et de gestion des métas données Les solutions alternatives L émergence [LE CANNELLIER, 2006] des plates-formes décisionnelles open source est une tendance forte. En le «Décisionnel Open Source» est quasi inexistant. Le lancement des grands projets date de Nous assistons à la création de sociétés et à la consolidation des projets en 2005 comme : Le rapprochement Actuate / Eclipse pour BIRT, Le lancement du BI stack Bizgres Clickstream, Le lancement de Pentaho, SpagoBI, Talend, Une maturation en un temps inégalé dans tout autre champ de l Open Source La mise en production dès 2006 des solutions alternative est une certitude. A titre d exemple, citons : Serveur de Rapport : Birt, JasperReports, JReport, Open Reports Serveur d analyse : Mondrian, JPivot, Bee Project, Palo Requêteur : Maccess, Mysqlquery browser ETL : Enhydra, Octopus EAI : OpenAdaptor Datamart : Mysql, PostgreSQL Datawarehouse : BizGres 132 ERP : Entreprise Resource Planning 227

230 Partie III - Chapitre 7 Etat de l art de l expérimentation Nous avons développé des offres de produits alternatifs en annexes [A4]. Cet état de l art au service de notre expérimentation montre l intérêt à envisager un SIS reposant sur un entrepôt. Un data warehouse intègre à la fois les données de production historisées et des données externes. Ces données sont fiables puisqu elles ont été contrôlées. Les outils sous jacents aux SIS permettent ainsi d accéder facilement aux données, de façon conviviale et flexible. Ils aident à la prise de décision de façon indéniable et reconnue. Nous avons pris connaissance de nombreux outils qui correspondent principalement aux différents maillons de l alimentation de l entrepôt de données, ainsi que des outils d analyse et de reporting. Nous constatons que les différents services de l université disposent essentiellement d infocentres plutôt que de réels systèmes orientés vers la prise de décision. Même si dans les services publics de l université, certains acteurs font de l intelligence économique sans le savoir, il n y a aucun service identifié comme tel dans l université. C est pourquoi nous orienterons notre expérimentation dans un contexte global à l université. Le chapitre qui suit est le lieu de l expérimentation de nos idées apportées à un niveau théorique. Notre domaine de recherche relève de l'information Scientifique et Technique et des Sciences de l Information et de la Communication et pour les applications relève de l'informatique. Les derniers chapitres prennent une dimension de convergence pour mettre en regard nos concepts développés, appartenant aux IST, aux SIC, et les outils d un système d information, empruntés à l Informatique, pour aboutir à une vérification, une rectification et une réalisation pratique en guise de «preuve». 228

231 Partie III - Chapitre 8 RUBI 3 RUBICUBE 229

232 230

233 Partie III - Chapitre 8 RUBI 3 RUBICUBE 8.1. Comment mettre en relation acteurs et ressources électroniques? Pour modéliser les ressources électroniques nous sommes partis des normes et des standards que nous avons enrichis pour être en mesure de proposer des classes d objets. L état de l art fait clairement ressortir l intérêt des dictionnaires de données. Nous nous appuyons sur les référentiels proposés par le Schéma directeur des espaces numériques de travail [SCHEMA, 2004], Ministère de la jeunesse, de l éducation nationale, et de la recherche pour élaborer des classes d objet autour des acteurs. Concentrons-nous sur l acteur «étudiant» de la Figure l univers étudiant est représenté par les classes suivantes : individu, inscription pédagog. étape, inscription admin. annuelle, inscription admin. étape resultats aux éléments, résultats aux étapes, résultats aux diplômes, stages, troisième cycle, couverture sociale, cursus pre-universitaire, diplôme, diplôme autre cursus, cursus, blocage, indicateurs. Chaque classe comporte des objets. Notre but est d améliorer l information proposée à l utilisateur. Nos trois classes d objets sélectionnées : «diplômes», «individu», «cursus» doivent nous permettre, par exemple d aider l acteur étudiant à améliorer ses connaissances autour d une discipline. Cursus Année dernier établiss. fréquenté Cycle universitaire (code) Cycle universitaire (lib.) Diplôme (code) Diplôme (lib.) Diplôme - Nature (lib.) Diplôme - Type (lib.) Diplômé (O) Session Diplômé (O/N) Etabliss.- Dernier fréquenté (code) Etabliss.- Dernier fréquenté (lib.) Filière (O/N) Filière (code) Filière (lib.) Groupe de diplômes (code) Groupe de diplômes (lib.) Niveau de formation (code) Niveau de formation (lib.) Version diplôme (code) Version diplôme (lib.) Résultat aux diplômes Présent à un examen : (O/N) Admission/Admissibilité Barême Mention : (code) Mention : (lib.) Note Note de substitution : (code) Note de substitution : (lib.) Point de jury Résultat : (code) Résultat : (lib.) Session : (lib.) Taux d'acquis Univers étudiant Individu Adresse annuelle - Code postal Adresse fixe - Code postal Adresse fixe - Commune (code) Adresse fixe - Commune (lib.) Année 1ère inscript. enseign. sup. Année 1ère inscript. Universitaire Année 1ère inscript. dans l'étab. Année de dernière inscription Année de sortie de l'établissement Groupe de pays (code) Groupe de pays (lib.) Individu - Code Etudiant Individu - Code Individu Individu - Niveau d'études (code) Individu - Niveau d'études (lib.) Individu Nom Individu Prénom Individu Sexe Individu - Individu - Login Naissance Année Naissance Date Naissance - Département (code) Naissance - Lieu (lib.) Naissance - Pays (code) Nationalité (lib.) Situation familiale (lib.) Type de handicap (lib.) Figure : Exemple de 3 classes d objet modélisant l acteur étudiant Pour l acteur étudiant, choisissons la classe «individu», qui permet de tirer parti des données existant dans les champs ou dans les vues partielles, en vue de les réutiliser pour lui permettre d améliorer ses recherches. 231

234 Partie III - Chapitre 8 RUBI 3 RUBICUBE Année 1ère inscript. enseign. sup. Année 1ère inscript. enseign. sup. : Caractère Adresse annuelle Code postal : Caractère Groupe de pays (code) : Caractère (lib.) : Caractère Année 1ère inscript. universitaire Année 1ère inscript. Universitaire : Caractère Année 1ère inscript. dans l'étab. Année 1ère inscript. dans l'étab. : Caractère Année de dernière inscription Année de dernière inscription : Caractère Année de sortie de l'établissement Année de sortie de l'établissement : Caractère Adresse fixe Code postal : Caractère Commune (code) : Caractère Commune (lib.) : Caractère Individu Code Etudiant : Numérique Code Individu : Numérique Niveau d'études (code) : Numérique Niveau d'études (lib.) : Caractère Nom : Caractère Prénom : Caractère Sexe : Caractère Caractère Login : Caractère Naissance Année : Numérique Date : Date Département (code) : Caractère Lieu (lib.) : Caractère Pays (code) : Caractère Situation familiale (lib.) : Caractère Type de handicap (lib.) : Caractère Figure : Développement de la classe individu pour l acteur étudiant La Figure fait apparaître des données propres à l identification de l étudiant, sa localisation géographique, son niveau d étude, son login, son historisation d inscription dans l établissement. Avant de poursuivre sur la modélisation d une composante, présentons et développons la classe «diplôme» formée d U.E. (unités d enseignement) : Diplôme U.E. Diplômes Id UFR Code dipl Nbre inscrits composé de * U.E. Code dipl Code UE Figure : Classe diplôme En développant la classe cursus de la Figure 8.1-1, les objets autour du diplôme nous renseignent sur les modules. Auparavant, analysons une composante pour observer les diplômes proposés. Voici les diplômes proposés par la composante UFR Mathématiques Informatique de Nancy 2 pour l année

235 Partie III - Chapitre 8 RUBI 3 RUBICUBE Diplôme : DEUG MISASHS 1A Id : 201 Code : 10X101 Nbre inscrits : 135 Intervention de Math-Info dans d'autres diplômes Inscrits : Diplôme : DEUG MIAGE Id : 201 Code : 10X102 Nbre inscrits : 32 Diplôme : DEUG MISASHS 2A Id : 201 Code : 10X201 Nbre inscrits : 45 Options Math-Stat-Info Inscrits : Diplôme : LICENCE MIAGE Id : 201 Code : 20X101 Nbre inscrits : 53 Diplôme : DEUST Animation, Médiation et Technologie 1A Id : 201 Code : 10X301 Nbre inscrits : 27 Diplôme : MAITRISE MIAGE Id : 201 Code : 25X101 Nbre inscrits : 42 Diplôme : DEUST Animation, Médiation et Technologie 2A Id : 201 Code : 10X302 Nbre inscrits : 15 Diplôme : LICENCE EN SCIENCES COGNITIVES Id : 201 Code : 20X1SC Nbre inscrits : 33 Diplôme : DEUST Animation, Médiation et Technologie 3A Id : 201 Code : 10X303 Nbre inscrits : 23 Diplôme : MAITRISE EN SCIENCES COGNITIVES Id : 201 Code : 25X1SC Nbre inscrits : 9 Figure : Modélisation des interventions et diplômes de la composante UFR Math de Nancy 2 Sur le même principe, choisissons le diplôme DEUG MISASHS Info 1A de la composante UFR Math de Nancy 2, pour développer le contenu des U.E. Figure : Modélisation d un diplôme DEUG MISASHS 1A 233

236 Partie III - Chapitre 8 RUBI 3 RUBICUBE La modélisation des types d acteurs a permis de modéliser l acteur étudiant, de développer les classes «individu» et «diplôme». Les attributs et les valeurs donnent des données chiffrées comme, le nombre d étudiants pour une discipline. Ils permettent de mettre en valeur des notions en procédant par des calculs par association : comme cerner les compétences d un étudiant autour d un domaine, repérer les étudiants à devoir repasser les examens de rattrapages ou de calculer le nombre de redoublants. Cette étape met en relief les éléments qui nous permettent de corréler acteurs et ressources documentaires. Comment? En analysant de près la Figure et la Figure les classes individu, réussite aux diplômes, stage et ressources d information permettent : de proposer des ressources par rapport aux diplômes suivis, d historiser le parcours en mettant en valeur les différentes étapes, de catégoriser les acquis comme compétence, notamment en procédant à des calculs par association des attributs et des valeurs Mise en relation du modèle des ressources documentaires et du modèle des acteurs Pour expliciter la mise en relation des ressources documentaires et des acteurs, imaginons un enseignant qui doit concevoir une même formation à deux publics d étudiants appartenant à des UFR différentes et un étudiant amené à améliorer ses compétences autour de modules. Prise en compte du contexte des utilisateurs D un côté par l appui des normes et standards nous avons élaboré des classes d objet pour les ressources documentaires. D un autre côté nous sommes à même d élaborer des classes d objet autour des acteurs. Nous répartissons ces classes d objets autour de quatre pôles qui prennent en compte le contexte de l utilisateur : Propriétés de la ressource : fonction pédagogique, format, forme, phase de conception, identifiant, Identification des besoins des utilisateurs auxquels répond un document : ressource, objet à définir, public concerné, principes d apprentissage, type, Données de description relatives au contexte : scénarios pédagogiques, titre, mots-clés, Ressources documentaires autour d un module : module, activités, experts, densité sémantique, couverture. La Figure représente le cœur de la mise en relation acteurs et ressources électroniques : 234

237 Fonction pédagogique de la ressource Cours Notice explicative Evaluation Examen Enseignant Code Enseignant : Numérique Code Individu : Numérique Composante (code) : Numérique Nom : Caractère Prénom : Caractère Sexe : Caractère Caractère Login : Caractère Phase de conception Discipline Nom du module Activité Titre Description de la ressource Format physique de la ressource Forme de la ressource Diapositive Figure Animation Identifiant de la ressource Coût Copyright Partie III - Chapitre 8 RUBI 3 RUBICUBE Objet à définir Accessibilité Durabilité Interopérabilité Pertinence pédagogique Collaboration Réutilisabilité Reconnaissance de la Propriété intellectuelle Adaptabilité Principes d apprentissage Pré requis Changement de concepts Modèles experts et conseils Complexité du contenu Représentations multiples Collaboration Individu Code Etudiant : Numérique Visualisation de la pensée Raisonnement analogique Code Individu : Numérique Formation de compétence Niveau d'études (code) : Numérique Métacognition Niveau d'études (lib.) : Caractère Public concerné Apprenant Composante (code) : Numérique Nom : Caractère Ressource Enseignement Prénom : Caractère Sexe : Caractère Caractère Login : Caractère Titre Langue Description Public concerné Identifiant de la ressource Type d une ressource Droit d usage Mot clé Rôle des utilisateurs Contexte éducatif Propriétés de la ressource Identification des besoins des utilisateurs auxquels répond un document Données de description relatives au contexte Ressources documentaires autour d un module Scénarios pédagogiques Objectif pédagogique Pré requis Déroulement Diplôme : DEUG MISASHS 1A Id : 201 Code : 10X101 Nbre inscrits : 135 Module Thème Sous discipline Experts Auteurs enseignants Activités Apprendre Observer S exercer Simuler S évaluer Nature : MISASHS Complément 1 Code : 12XUE103 Nature : UE Id : XMA106 Informatique outils TDI 12XCH103 Langue vivante UE 3 CHOI Titre Mots-clés Identifiant Nature de la ressource Discipline Motbis European treasury browser Densité sémantique Contexte d utilisation Niveau des apprenants Couverture de la ressource Epoque Culture Géographie Figure : Prise en compte du contexte des utilisateurs 235

238 Partie III - Chapitre 8 RUBI 3 RUBICUBE Nous tirons parti des principes de la table en constellation de faits exposé dans l état de l art autour de l entrepôt de données. Au niveau du pôle «propriétés de la ressource», nous ajoutons la table de faits «enseignant». Nous ajoutons la table de faits des étudiants «individu» au pôle «identification des besoins des utilisateurs auxquels répond un document». Nous ajoutons la classe «diplôme» au pôle «données de description relatives au contexte». L élément «unité d enseignement» est placé dans le pôle «ressources documentaires autour d un module». La Figure illustre la mise en relation des classes d objets propres aux acteurs et des classes d objets propres aux documents. Notre exemple permet de mettre en relation l enseignant créateur d une ressource à l attention de l étudiant. La table de faits «enseignant» renseigne sur la composante de l enseignant ainsi que sur la discipline concernée par le document. On retrouve la composante dans la table de faits «étudiant». La table de faits «étudiant» indique le niveau d étude de l apprenant. L élément niveau d étude de l étudiant peut être mis en correspondance avec les pré-requis nécessaires de l apprenant, pour aborder une ressource documentaire. La description de la discipline du document, permet une mise en relation avec le diplôme poursuivi de l étudiant. La description de l unité d enseignement favorise une mise en relation avec les ressources documentaires autour de modules spécifiques. Ce cheminement théorique met en évidence que nous disposons de données descriptives sur les acteurs et les ressources. Ces données descriptives constituent des métas données. C est bien par l intermédiaire de ces métas données que nous pouvons favoriser un modèle d intégration au sein d un entrepôt de ressources à la destination d acteurs identifiés. Nous venons de montrer que par l intermédiaire d un entrepôt de données il est possible d agréger à une ressource documentaire un profil utilisateur. Ce raisonnement ne fut pas simple à concevoir, à cause des recherches actuelles qui tournent autour des moteurs de recherche fédérée où l acteur est dans une situation de «Pull» lorsqu il pose une question à l aide de mots clés. Les difficultés à réfléchir sont également venues du procédé même de la syndication de contenu où l acteur dans un espace numérique de travail peut choisir des portlets pour enrichir son environnement de travail. Il a fallu pour cela conceptuellement s inscrire dans une situation de «Push» où un certain nombre d information doit être à la disposition de l acteur à une certaine période dès qu il s identifie. Ce processus d anticipation vient compléter et non se substituer à l environnement proposé lorsque l acteur interroge le système d information après authentification. La finesse d élaboration des métas données autour des ressources documentaires, financières, réglementaires, administratives ou 236

239 Partie III - Chapitre 8 RUBI 3 RUBICUBE pédagogiques et des acteurs avec la prise en compte de leur contexte permet un environnement adapté en fonction des besoins de l utilisateur. En fonction de son rôle, l utilisateur pourra visualiser des niveaux d information. Un étudiant de première année dès qu il se connecte sur le système n a pas besoin dans son environnement de voir des bases de connaissances autour des thèses. Un enseignant appréciera de voir des données statistiques relatives à la consultation de ses cours. Les responsables du développement de l ENT souhaitent être en mesure d analyser la consultation des services qu ils déploient. Un thésard peut-être amené à faire de la fouille de données pour débuter son état de l art! L entrepôt de données permet de rendre «intelligente» des données et c est en cela qu elles deviennent des informations stratégiques. Il s agit d offrir des vues orientées acteurs. Nous montrons comment il est possible d améliorer la représentation des utilisateurs pour la fabrication des bases métiers et aboutir à un modèle formel, nommé RUBI 3, qui signifie {Représentation des Utilisateurs et de leurs Besoins en Information lors de l Interrogation après Identification}. RUBI 3 permet de donner des vues différentes du Système d Information Stratégique aux différents acteurs. L idée est d intégrer le modèle de l acteur parmi les métas données de l entrepôt et donc de construire les bases métiers automatiquement selon le profil de la personne à laquelle il est destiné. La prise en compte de RUBI 3 pour la réalisation du profil utilisateur va de paire avec la construction de l entrepôt de données dont nous résumons les différentes étapes qui nous intéressent par l acronyme RUBICUBE qui signifie {Récupération, Utilisateur, Besoins, Identification, Classification, Usinage, Bases métiers, Enrichissement}. La symbolique de l image fractale qui transparaît au travers de cet acronyme permet de renforcer l idée de l imbrication entre entrepôt de données et utilisateur dès la conception ou l amélioration du système d information. Récupération Utilisateur Besoins Identification Classification Usinage Bases métiers Enrichissement S S I D S Représentation Utilisateur Besoins Information Interrogation Identification RUBICUBE RUBI 3 Figure : Imbrication de RUBI 3 et RUBICUBE 237

240 Partie III - Chapitre 8 RUBI 3 RUBICUBE Nous allons par une expérimentation tirer parti de ce modèle. Nous verrons comment cette expérimentation en deux phases permet d affiner le modèle. Pour mener à bien notre expérimentation nous utiliserons la suite Cognos qui appartient à la gamme des produits payants puis aborderons un produit alternatif qui sera exploité pour notre application Phase 1 : expérimentation 2005 avec un produit commercial - COGNOS Comment avons-nous travaillé? En , par l intermédiaire de la directrice des moyens informatiques de l Université Nancy 2, nous avons pu récupérer des données d Apogee concernant les étudiants inscrits à l Université Nancy 2 mais en format propriétaire de Business Object. Ne possédant pas la licence de ce logiciel, nous avons préféré réduire notre échantillon et travailler uniquement sur des données concernant le Pôle Lorrain de Gestion de l Université Nancy 2 et plus spécifiquement pour l UFR MI. Chaque année, des informations sous forme de maquette Excel parviennent à l UFR MI. Ces informations correspondent aux interventions que l UFR MI exerce pour les onze diplômes assurés par elle mais aussi dans d autres diplômes non délivrés qu elle ne délivre pas. Suite à la première étape du processus de modélisation de l utilisateur nous avons communiqué la représentation de l utilisateur RU = (T, B, F, A) ainsi que notre article [PEGUIRON et THIERY, 2004] accepté pour VSST 2004 à deux étudiants du DESS ACSI avec qui nous avons travaillé en collaboration pour expérimenter notre représentation de l utilisateur. A partir des maquettes d enseignements et diplômes de l UFR MI, nous leur avons demandé d exploiter les informations contenues dans les maquettes Excel sous différents points de vue en tenant compte de la représentation de l utilisateur : point de vue de la directrice qui s intéresse plus particulièrement à la charge en heures équivalents TD par étudiant, point de vue de l université qui s intéresse surtout au coût d un diplôme, point de vue d un étudiant qui cherche surtout à savoir quelle est sa charge horaire de travail, point de vue d un enseignant de l UFR MI qui cherche à se renseigner sur le nombre d heures qu il doit exercer dans les diplômes de l UFR MI. 238

241 Partie III - Chapitre 8 RUBI 3 RUBICUBE Le projet consiste donc à construire un hypercube à partir des maquettes Excel fournies par l UFR MI en tenant compte des différents acteurs (étudiant, enseignant, directrice de l UFR MI et l Université). Il faut créer un hypercube pour chaque acteur puisque les informations nécessaires ainsi que les mesures vont être différentes. Ces hypercubes sont exploités par la création des rapports qui répondent aux différentes questions que se posent les acteurs. Nous nous appuyons d une part sur le processus de modélisation de l utilisateur et sur le processus de modélisation de création d un entrepôt de données pour la réalisation de ce projet. En possession de la licence Cognos, nous orientons notre choix sur ce logiciel pour la phase I de l expérimentation. Nous avons élaboré un guide d installation de Cognos en annexes [A2] Récupération des données Avant de créer les hypercubes sous Cognos, il faut récupérer toutes les informations nécessaires pour la création des hypercubes. Sources de données existantes Nous disposons des sources de données suivantes : Les maquettes EXCEL remplies par les responsables des différents diplômes de l UFR MI. Les maquettes contiennent les informations concernant les interventions que fait l UFR MI pour les diplômes qu elle délivre ainsi que pour quelques diplômes dont elle n est pas responsable. En entête des maquettes, on trouve les informations propres au diplôme comme son nom, son code ou encore le nombre d inscrits. Ensuite, chaque ligne du tableau décrit les différentes unités d enseignement et leurs différentes matières (avec leur code, leur libellé et leur nature (cours, TD, unité d enseignement) avec le nombre d heures équivalentes TD, le nombre de groupes, volume étudiants.). Pour créer l hypercube depuis Transformer, nous avons la possibilité d importer directement les fichiers Excel. Or cela parait difficile car cela demande un gros travail de formatage des fichiers Excel pour qu ils soient exploitables par Cognos. Nous avons donc choisi de passer par Access, ce qui parait plus explicite. Il faut transférer les fichiers Excel sous Access puis récupérer les données Access sous Transformer. EXCEL ACCESS COGNOS Transfert des données Transfert des données 239

242 Transfert des données de Excel vers Access Partie III - Chapitre 8 RUBI 3 RUBICUBE Afin de transférer les données d Excel vers Access, nous devons passer par les étapes suivantes : Reformater les maquettes Excel, Créer un schéma entités associations sous Access, Remplir la base de données créée avec les données contenues dans les maquettes Excel. Reformatage des maquettes Excel Afin de rendre les données des maquettes Excel exploitables par Access il est nécessaire de reformater ces fichiers. Ce reformatage comprend la suppression des entêtes, le rajout de code de la matière et le nettoyage de données inutiles pour notre étude. Informations spécifiques au diplôme. Les entêtes vont être supprimés. Les colonnes «Proposition Commission HC» et «Total HETD Commission HC» Pour chaque unité d enseignement puis pour chaque matière La ligne «Total» va être supprimée Figure : Maquette Excel avant la phase de reformatage 240

243 Partie III - Chapitre 8 RUBI 3 RUBICUBE Les copies d écran ci-dessus et ci-dessous montrent les maquettes d IUP MIAGE (1 ère année) avant et après la phase de reformatage. Dans l exemple du DEUG MIAGe, il n y a qu un groupe et qu un enseignant pour chaque matière donc nous avons rajouté les noms et les prénoms des enseignants directement dans la maquette. Par contre, pour la licence MIAGe, nous avons créé une feuille supplémentaire avec toutes les informations nécessaires. Après avoir reformaté les maquettes Excel, nous pouvons utiliser la fonction «importation» d Access. Pour chaque maquette, nous importons les données brutes dans une table. Nous disposons d une table pour chaque maquette. Les noms de colonnes ont été parfois modifiés et seront identiques dans chaque maquette. Ajout des enseignants Ajout du code et du libellé du diplôme Figure : Maquette Excel après la phase de reformatage 241

244 Partie III - Chapitre 8 RUBI 3 RUBICUBE Création d un schéma entités associations L étape suivante consiste à créer un schéma Entité Association sous Access pour pouvoir ensuite transférer les données brutes obtenues dans les tables correspondantes. La figure suivante nous montre le schéma E/A que nous avons crée depuis Access. Figure : Schéma entités associations La base de données est constituée des tables suivantes : «Diplôme» : Cette table concerne les différents diplômes de l UFR MI. Chaque diplôme est constitué d un code, d un libellé, d un nombre d étudiants inscrits et d un cycle (1, 2 ou 3). «TypeEnseignement» : La table «TypeEnseignement» indique le type de chaque ligne enregistrée dans VolumeHoraire : un cours peut être un TD, un cours magistral ou une unité d enseignement. Elle contient également un coefficient multiplicateur qui sert à multiplier pour obtenir le nombre d heures (exemple : 1,5 pour les cours magistraux). «Enseignant» : Cette table contient les différents enseignants officiant au nom de l UFR MI. Chaque enseignant est composé d un identifiant (numéro), d un nom, d un prénom, d une adresse mail, d une spécialité (Mathématique ou Informatique), d un potentiel grade, d un nombre d heures théoriques et d un nombre d heures exercées réellement. «TypeMatière» : Cette table nous renseigne sur le type de matière, c est à dire Informatique ou Mathématique. 242

245 Partie III - Chapitre 8 RUBI 3 RUBICUBE «Matière» : La table «Matière» concerne les différentes matières concernant l UFR MI. Chaque matière est constituée d un code, d un libellé et d une nature qui fait référence à la table «TypeMatière». «EnseignantMatière» : Cette table renseigne sur le numéro du professeur qui enseigne une matière pour un type d enseignement. Cette triple association permet d avoir plusieurs professeurs pour la même matière et le même type d enseignement. «VolumeHoraire» : Cette table est une association à 3 pattes entre les tables Matière, TypeEnseignement et Diplôme. C est la table centrale de la base : elle regroupe tous les cours dispensés par l UFR MI et les différentes mesures s y rapportant (nombre de groupe, nombre d heures, nombre d inscrits). Ces mesures ont été importées à partir des maquettes Excel mises à disposition. Remplissage de la base Access par requêtes Une fois l importation des fichiers Excel sous forme de tables effectuée, nous avons à notre disposition plusieurs tables sans clé primaire mais auxquelles nous avons donné les mêmes noms de champ afin de mieux les exploiter ensuite. Pour chaque diplôme, nous avons une table avec les champs suivants : Figure : Exemple de table pour un diplôme Pour certains cours ou TD où plusieurs professeurs interviennent, nous rajoutons une table reprenant ces enseignants et les matières correspondantes de la forme suivante (l exemple cidessous concerne le diplôme «DEUG Sciences du Langage de première année») : Figure : Exemple de table rajoutée pour certains cours Nous avons procédé de la même façon pour tous les diplômes : en utilisant des modèles de requêtes à adapter à chaque table. Nous montrons comme exemple l importation des données du DEUG Sciences Du Langage 2 ème Année. 243

246 Tout d abord, nous récupérons les enseignants de ce diplôme : Partie III - Chapitre 8 RUBI 3 RUBICUBE Requête Ajout_prof_sdl2 : INSERT INTO Enseignant ( NomProf, PrenomProf ) SELECT DEUG_SDL_2A.NomEnseignant, DEUG_SDL_2A.PrenomEnseignant FROM DEUG_SDL_2A WHERE (((DEUG_SDL_2A.NomEnseignant) Not In (select distinct NomProf from Enseignant))); Remarque : nous ne reprenons que les enseignants qui ne sont pas encore recensés (clause Where)! Ensuite, nous récupérons les matières correspondantes : Requête Ajout_mat _sdl2 : INSERT INTO Matière ( CodeMatière, LibelléMatière ) SELECT DEUG_SDL_2A.CodeElt, DEUG_SDL_2A.Elément FROM DEUG_SDL_2A WHERE (((DEUG_SDL_2A.Commun)= UFR MI )); Les enseignants étant identifiés par un numéro automatique, il faut donc ajouter un champ «noprof» à la table DEUG_SDL_2A_Profs pour les reconnaître. Nous mettons alors ce champ à jour à partir de la table Enseignant : Requête Maj_noprof_sdl2 : UPDATE Enseignant INNER JOIN DEUG_SDL_2A_Profs ON Enseignant.NomProf = DEUG_SDL_2A_Profs.NomEnseignant SET DEUG_SDL_2A_Profs.noprof = Enseignant.noprof; A partir de là, nous pouvons indiquer quel(s) enseignant(s) a mené tel cours (ou TD): Requête ensmat_sdl_2 : INSERT INTO EnseignantMatière ( NoProf, CodeMatière, TypeEnseignement, NbGroupe ) SELECT DEUG_SDL_2A_Profs.noprof, DEUG_SDL_2A_Profs.CodeElt, DEUG_SDL_2A_Profs.Nature, DEUG_SDL_2A_Profs.NbGroupe FROM DEUG_SDL_2A_Profs; Nous avons alors ajouté les différentes informations des maquettes dans la table VolumeHoraire. La structure des tables que nous avons créées correspond à celle de VolumeHoraire. Requête Ajout_deug_sdl : INSERT INTO VolumeHoraire ( CodeMatière, TypeEnseignement, CodeDiplome, VolumeEtudiant, NbHeuresProf, NbHeuresTotalReel, NbGroupeThéo, NbInscrits ) 244

247 Partie III - Chapitre 8 RUBI 3 RUBICUBE SELECT DEUG_SDL_2A.CodeElt, DEUG_SDL_2A.Nature, DEUG_SDL_2A.CodeDiplome, DEUG_SDL_2A.VolumeEtudiant, DEUG_SDL_2A.HETD, DEUG_SDL_2A.TOTAL HETD calculé, DEUG_SDL_2A.NbGroupesThéoriques, DEUG_SDL_2A.Inscrits FROM DEUG_SDL_2A WHERE (((DEUG_SDL_2A.Commun)= UFR MI )); Finalement, nous n avons pas pu créer tous les diplômes de l UFR MI. Sur les onze diplômes, nous en avons récupéré sept. Les quatre diplômes manquant sont : DESS ACSI, DESS SID, DEUST, Maîtrise en Sciences Cognitives. Quant aux deux DESS, si nous souhaitons les intégrer, il faut refaire complètement les maquettes Excel. En effet, les fichiers Excel ne sont pas organisés en matières mais en module qui regroupe de nombreuses matières. Nous avons donc un grand nombre d enseignants pour chaque module sans savoir le nombre d heures que fait chacun d eux dans un module. Il faut donc refaire la maquette en détaillant les modules en intégrant les matières puis trouver toutes les informations nécessaires (enseignant de cette matière, volume étudiant, HETD, ) Création des hypercubes Description de la méthode Pour chaque acteur, nous avons créé un hypercube correspondant avec les informations dont l acteur a besoin. Ici nous restituons uniquement la démarche pour l acteur étudiant. [CAMU et GAYOT, 2004] proposent la démarche complète pour l acteur enseignant, directrice et université afin de ne pas alourdir la lecture. Par exemple, un étudiant n a pas besoin de toutes les informations. Les hypercubes sont fondés sur des requêtes de sélection SQL que l on récupère grâce au logiciel Transformer de Cognos. 245

248 Partie III - Chapitre 8 RUBI 3 RUBICUBE Figure : Transformer récupère les données de la requête SQL Les dimensions ainsi générées ne correspondent généralement pas à ce que nous attendons. Nous modifions donc les dimensions afin d obtenir un cube correct. De plus, toutes les sources de données numériques sont placées dans les mesures y compris les identifiants (ou codes). Il faut vérifier et modifier (si nécessaire) les mesures que Transformer affiche. Hypercube Etudiant L étudiant lambda cherche à savoir combien d heures de formations il a dans son diplôme. Nous ne sélectionnons donc que le diplôme, les matières associées et VolumeEtudiant qui correspond au nombre d heures par étudiant. Requête RequêteEtudiant SELECT Diplome.Libelle, Matière.NatureMatière, Matière.LibelléMatière, VolumeHoraire.VolumeEtudiant FROM Enseignant, Matière, EnseignantMatière, Diplome, VolumeHoraire WHERE Matière.CodeMatière=VolumeHoraire.CodeMatière AND VolumeHoraire.CodeDiplome=Diplome.CodeDiplome AND VolumeHoraire.TypeEnseignement=EnseignantMatière.TypeEnseignement AND EnseignantMatière.CodeMatière=Matière.CodeMatière AND EnseignantMatière.TypeEnseignement=VolumeHoraire.TypeEnseignement; Nous définissons ensuite deux dimensions : Diplôme car nous souhaitons avoir le volume horaire d un étudiant par diplôme de l UFR MI NatureMatière car nous souhaitons obtenir le volume horaire d un étudiant par nature de matière (info, maths ou autres) puis par matières. 246

249 Partie III - Chapitre 8 RUBI 3 RUBICUBE Figure : Grille des dimensions Nous obtenons les diagrammes suivants (après avoir généré les catégories) : Dimension Figure : Diagramme de la dimension Diplôme Figure : Diagramme de la dimension NatureMatière 247

250 Partie III - Chapitre 8 RUBI 3 RUBICUBE Rapport Powerplay pour l hypercube Etudiant Nous montrons le rapport établi sur Powerplay à partir de l hypercube étudiant. Dans l exemple suivant, nous obtenons le volume horaire d un étudiant pour la maîtrise MIAGe suivant la nature des matières (Maths, Informatique, Autres) et le total. Pour obtenir cet histogramme en barres, nous plaçons les diplômes en couche pour avoir le volume horaire PAR diplôme. Ainsi, pour passer à un autre diplôme, il suffit de passer à une couche suivante ou précédente. Nous plaçons la dimension NatureMatière en abscisse et la mesure du volume horaire en ordonnée afin d avoir le volume horaire en fonction de la nature des matières. Diplôme en couche Changement de couche Nature des matières Figure : Rapport Powerplay pour l hypercube étudiant Nous pouvons également visualiser les mêmes informations sous forme de camembert (nous ne pouvons par conséquent pas visualiser le total), ce qui rend mieux compte de la proportion d informatique et de mathématiques enseignées dans le diplôme. En effet, on remarque que l enseignement informatique est majoritaire en maîtrise MIAGe. 248

251 Partie III - Chapitre 8 RUBI 3 RUBICUBE Figure : Autre représentation visuelle de l hypercube étudiant Si nous cliquons sur une nature de matière, nous obtenons le volume horaire pour cette nature de matière. Par exemple, si nous cliquons sur Maths, nous voyons le volume horaire d un étudiant de Maîtrise MIAGe pour les matières mathématiques (cf figure ci-dessous). Figure : Volume horaire d un étudiant de Maîtrise MIAGe Le problème de cette visualisation du volume horaire, est que PowerPlay affiche toutes les matières mathématiques de tous les diplômes de l UFR MI dans la légende, ce qui devient vite illisible vu le nombre de matières pour chaque nature. 249

252 Bilan de la phase I de l expérimentation Partie III - Chapitre 8 RUBI 3 RUBICUBE La première phase d expérimentation sur la gestion des maquettes d enseignement et diplômes de l UFR a permis de travailler sur un véritable cas concret de réalisation d hypercubes avec les sources de difficultés non seulement techniques mais aussi organisationnelles que cela implique. Nous avons montré comment, à partir d une même source de données, créer plusieurs cubes distincts en fonction des acteurs prédéfinis et de leurs besoins pour ne prendre que les informations essentielles. Nous avons pu constater les difficultés rencontrées à la collecte de données que ce soit au niveau temps, au niveau format ou au niveau pertinence. Ainsi, la constitution d un entrepôt de données, qui constitue le socle de la réalisation de l expérimentation, prend un temps considérable. Le point fort de Transformer est qu il est puissant et facilement utilisable pour la création d hypercube à partir d interrogations Access. Mais ça n est vraiment pas le cas pour d autres formats de données comme Excel où la démarche à suivre est plutôt floue. Nous avons choisi par commodité un passage des fichiers Excel sur une base Access qui est plutôt aisé lorsque les fichiers sont correctement formatés : mais cela implique d avoir déjà une idée préalable sur la nature des données. Transformer, malgré une proposition automatique de cube en général fausse, permet facilement de créer de nouvelles mesures et d avoir une vue simple des dimensions. Un de ces inconvénients est qu il a toujours tendance à effectuer des sommes pour les mesures (choix par défaut) : ce qui peut créer des surprises et des informations farfelues. PowerPlay est vraiment facile d utilisation et permet aisément de jongler entre les dimensions, mesures ou couches. Les ennuis se situent au niveau des colonnes récapitulatives et l absence de lien entre les dimensions, ce qui fait que nous nous sommes souvent retrouvés avec de nombreuses colonnes ou lignes à valeur nulle donc non nécessaires. Il serait intéressant de voir comment pallier à ce problème car en cas de très grand nombre, le masquage manuel devant s appliquer au cas par cas s avère fastidieux Phase 2 : expérimentation 2005/2006 avec un produit commercial - COGNOS La présente expérimentation a été réalisée avec l aide de trois étudiants [CHAIX et VELY et VISE, 2006] dans le cadre de leur Master Miage spécialité Audit et Conception des Systèmes d Information (ACSI) pour leur projet d application La réalisation de ce projet 250

253 Partie III - Chapitre 8 RUBI 3 RUBICUBE permet par une réalisation pratique la mise en œuvre des idées que nous avons développées dans notre thèse. Comment avons-nous travaillé? Nous avons convenu de nous réunir régulièrement pour établir un scénario de travail. Nous nous sommes orientés vers un travail collaboratif en grandeur nature. Nous avons respecté les voies protocolaires pour obtenir les données dont nous avions besoin. C est-à-dire que le Professeur Odile Thiéry s est adressée à la Directrice du Centre de Ressources Informatiques (CRI) de l Université Nancy 2 et à la Directrice du Service Commun de Documentation (SCD) du Pôle Lorrain de Gestion (PLG) pour nous permettre d obtenir leur aval afin de récupérer les données nécessaires à nos travaux. Nous avons ensuite rencontré d une part l informaticien du CRI avec qui nous avons pu travailler pour exprimer nos besoins et avons obtenu des fichiers de login de l espace ENT de l Université Nancy 2. D autre part la bibliothécaire du PLG nous a fourni des données statistiques spécifiques au SCD du PLG. Riches de la première expérience où nous avions essentiellement communiqué lors des réunions et par messagerie électronique, nous avons cette année amélioré nos procédures de travail par la mise en place d un environnement de travail partagé. Cet espace proposé par le portail Yahoo, offre tous les services nécessaires dont nous avions besoin : messagerie partagée, environnement de discussion, dépôt de fichiers, signets, base de données, identification des membres, possibilité de lancer des sondages et agenda partagé. Ainsi il est possible à la création d un groupe dans Yahoo de faire émerger la notion de communauté d appartenance (ici les personnes amenées à travailler ensemble) et la notion de thématique (ici un travail collaboratif autour de l entrepôt de données). Avant de nous rencontrer, nous pouvions préparer la réunion en déposant dans le groupe yahoo tous les documents nécessaires. L espace dépôt de fichiers permet de recueillir le fruit du travail des uns et des autres sur les données. Cette façon de travailler favorise l avancement du traitement des données par une aide mutuelle : lors d une difficulté, les personnes selon leur compétence prennent en charge le problème pour proposer des solutions. C est ainsi que nous avons pu proposer une «check list» des étapes à mener ainsi qu une palette d outils. Par rapport aux travaux de l an passé où l expérimentation était menée via l outil Cognos du début à la fin, celle-ci comportait un défi qui consistait à mener l expérience en parallèle via deux outils différents : Cognos et Openi (logiciel libre). Compte tenu de la charge que cela 251

254 Partie III - Chapitre 8 RUBI 3 RUBICUBE représentait, cette expérimentation a pu aboutir pour la partie Cognos, elle est restée au stade d un lourd travail préparatoire dont nous tirons parti pour notre application qui occupe le chapitre 9 de notre thèse. Dans le cadre de nos travaux de recherche, le but du projet est de construire et d exploiter des hypercubes universitaires prenant en compte les recherches effectuées par les étudiants sur les différents SI universitaires. Ces hypercubes sont directement intégrés dans nos travaux concernant les entrepôts de données de ressources documentaires. Ces entrepôts ont pour but d améliorer l offre de recherche et la visibilité des informations. Pour faire suite à la première phase de l expérimentation nous exploitons de nouvelles données. Ces données sont extraites de deux systèmes d information de l université de Nancy : HORIZON (base de données de la bibliothèque du pôle de gestion) et l ENT (l espace numérique de travail de Nancy 2). Il s agit de récupérer un maximum de données brutes et de les retravailler afin de pouvoir les exploiter dans un cube. BiblioGQL permet d exploiter des données d HORIZON plus affinées sur l emprunt de documents au sein de la bibliothèque du pôle de gestion. L ENT fournit à travers des fichiers XML, des données générales sur les recherches effectuées sur la plateforme. Le projet consiste donc à trouver un moyen de construire un hypercube à partir de fichiers XML fournies par l ENT et de fichiers Excel provenant de la bibliothèque Récupération des données Avant de créer les hypercubes sous Cognos, il est nécessaire de récupérer les informations dont nous allons avoir besoin. Pour cela, nous avons à notre disposition deux sources de données bien distinctes. La première source de données nous est fournie par le Centre de Documentation du Pôle Lorrain de Gestion. La seconde partie des données provient de fichiers «log» de la plateforme universitaire ENT, fournie par le CRI (Centre de Recherche et d Information). Cette partie fait état du retraitement des différents fichiers afin de pouvoir les importer convenablement dans la suite Cognos. Deux sources de données utilisées Comme nous venons de le voir, nous avons utilisé deux types de fichiers, contenant des informations bien distinctes. Nous allons commencer par le traitement des fichiers du service 252

255 Partie III - Chapitre 8 RUBI 3 RUBICUBE commun de la documentation. Ensuite nous aborderons le traitement des fichiers de «log» de l ENT. 1) Des fichiers Excel fournis par Le Centre de Documentation. Le service commun documentation utilise le SIGB Horizon, qui permet de gérer tous les types de supports d information au niveau des acquisitions, de la diffusion et de la circulation du fonds documentaire. Ce logiciel est fondé sur une base de données Sybase permettant la gestion complète de la bibliothèque (prêts, nouveaux livres à insérer, classification, etc..). De plus, ils utilisent un logiciel appelé BiblioGQL qui fournit une interface conviviale permettant de réaliser des requêtes sur cette base. Il est donc possible via ces deux logiciels d obtenir des statistiques sur l activité du centre, soit grâce à des rapports types présents dans horizon, que l on peut générer au format désiré, soit par le biais de requêtes plus ciblées dans BiblioGQL. N ayant pu avoir accès à ce logiciel pour des raisons de sécurité et de maintien de l activité de la base, il nous a été transmis des fichiers générés depuis Horizon. Voici un exemple de fichier fourni : Figure : Exemple d un fichier fourni par le Centre de Documentation Cependant, le formatage des fichiers Excel, n étant pas toujours aussi clair que ci-dessus, de nombreuses adaptations on dû être réalisées. Pour créer l hypercube depuis Transformer, nous avons la possibilité d importer directement les fichiers Excel. Comme l a démontré la phase I de l expérimentation, cela présente des difficultés et nécessite un gros travail de formatage des fichiers Excel pour qu ils soient exploitables directement par Cognos. 253

256 Partie III - Chapitre 8 RUBI 3 RUBICUBE Reformatage des fichiers Excel Concernant les rapports fournis par le Centre de Documentation, nous distinguons deux types de fichiers. Un premier type de fichier, correspondant à une requête bien précise, et contenant donc qu un seul tableau de données. Il est donc très simple de l adapter en vue de son importation dans Access, car seul l entête doit être supprimé comme suit : Partie du fichier à supprimer Identifiants Partie du fichier à supprimer Figure : 1 er type de fichier fourni Figure : 2 ème type de fichier fourni Le second type de fichier de la Figure , est nettement plus compliqué à retravailler. En effet, il se compose de plusieurs résultats de requêtes mis les uns à la suite des autres. De plus, les identifiants de colonnes ont été cassés, ce qui rend leur compréhension difficile. Cependant, nous avons là aussi créé un fichier Excel différent pour chaque résultat en adaptant les noms de colonnes. Après traitement, on obtient le fichier suivant, propre et prêt à être importé dans Access. Figure : Exemple de fichier retraité Nous avons donc choisi de passer par Access, ce qui nous parait plus explicite, cette méthode permet de gagner du temps (Access se chargeant de l import d une structure de table et des valeurs depuis un fichier Excel propre). Une fois ce travail de préparation fini, nous créons 254

257 Partie III - Chapitre 8 RUBI 3 RUBICUBE des bases Access pour chaque fichier Excel «propre» obtenu afin de les importer sous Transformer pour créer nos cubes. Ci-dessous, nous reprenons la démarche globale d importation de données sous Transformer explicitée en phase I de l expérimentation : EXCEL Transfert des données ACCESS Transfert des données COGNOS Création des hypercubes Après avoir réalisé les étapes de retraitements de fichiers, puis de créations de toutes les bases nécessaires, nous créons des hypercubes avec la suite Cognos (Powerplay, Transformer). Comme nous l avons montré en phase I de l expérimentation le logiciel «Transformer» permet la génération de cubes à partir de différentes sources de données. Voici la démarche suivie. Description de la méthode Pour chaque fichier source, nous avons créé un ou plusieurs hypercubes correspondants. Cela permettra une utilisation et une analyse simplifiée. Ces hypercubes sont fondés sur les bases Access préalablement créées. Le logiciel Transformer permet d importer les données à partir des différents types de sources de données. Il permet d organiser et d enrichir les données que nous voulons faire apparaître dans le cube final. Voici ci-dessous un hypercube récupéré à partir de Transformer : Figure : Récupération des données de la base Access via Transformer Nous générons ensuite automatiquement les catégories du cube ainsi que le cube correspondant. Les dimensions ainsi générées ne correspondent généralement pas à ce que 255

258 Partie III - Chapitre 8 RUBI 3 RUBICUBE l on attend. Il est donc nécessaire d adapter les dimensions afin d obtenir un cube correct. De plus, toutes les sources de données numériques sont placées dans les mesures y compris les identifiants (ou codes). Il faut donc vérifier et modifier (si nécessaire) les mesures que Transformer affiche. Dans notre exemple, nous obtenons la catégorisation suivante : Figure : Exemple de catégorisation Après cette dernière étape, on obtient ainsi nos cubes prêts à être exploités dans Powerplay. Figure : Cube du nombre d exemplaires prêtés par catégorie pour l année 2005 Nous avons privilégié une forme de représentation qui soit lisible pour l analyse. 256

259 2) Les fichiers «log» du portail ENT de l Université Nancy 2 : Partie III - Chapitre 8 RUBI 3 RUBICUBE Ce sont des fichiers au format XML, contenant les informations des connexions sur le portail de l Université Nancy 2 (les services visités, nombre de visiteurs ) selon un critère temps tel que jour, ou mois, ainsi qu avec un découpage par services. On peut distinguer deux types de fichiers : Premiers types de fichiers Les fichiers mensuels contenant plusieurs types d informations. Un récapitulatif du mois, en entête, une partie par jours concernant les types de visiteurs (Etudiants, Professeurs ). Puis une dernière partie concernant les traitements liés à la plate forme réalisés au cours du mois. Ils se présentent sous la forme suivante : Statistiques globales du mois Statistiques par jour Figure : Haut du fichier XML Statistiques liées aux traitements Figure : Bas du fichier XML Seconds types de fichiers Les fichiers mensuels du serveur contenant eux aussi plusieurs types d informations sont beaucoup plus conséquents que les précédents. Ils se composent donc d un récapitulatif du mois, en entête et d une partie par jour concernant les types de visiteurs (Etudiants, Professeurs ) par services. La principale différence avec le premier type de fichier est qu ici, il y a une hiérarchie de plus : «les services» présents sur l ENT. Ils se présentent sous la forme suivante : 257

260 Partie III - Chapitre 8 RUBI 3 RUBICUBE Statistiques pour le mois, par services et type d utilisateur Figure : Haut du fichier serveur XML Statistiques par jours, par services et type d utilisateur Figure : Bas du fichier serveur XML Phase préalable de retraitement des fichiers Tout d abord, il est important de noter que pour des questions de compatibilité avec XML, ainsi que pour une meilleure gestion des importations, nous avons utilisé la suite Office 2003 (les versions antérieures ne gérant pas bien les données XML). Transfert des données XML vers Excel Il est nécessaire, afin de pouvoir importer les données XML dans un cube, de les retraiter avant importation. Après plusieurs essais (parseurs, conversion XML vers mysql avec le logiciel Navicat, importation directe dans Access, ), la méthode la plus fiable, et la plus pratique s est avérée être l utilisation de fichiers Excel temporaires, que nous importons par la suite dans Access. En annexes [A5] nous présentons les différentes étapes suivies afin d obtenir un fichier Excel reflétant la hiérarchie d un fichier XML. 258

261 Partie III - Chapitre 8 RUBI 3 RUBICUBE Les balises XML forment donc l entête des colonnes, les données sont structurées de façon à respecter la cohérence des données. Voici un exemple de fichier que nous avons obtenu après importation. On peut noter qu il peut être découpé en trois grandes parties (correspondant aux trois parties formant le fichier source cf. fichiers log) comme le montrent les trois images suivantes : Statistiques pour le mois, par services et type d utilisateur Figure : Fichier obtenu partie «Traitements» Statistiques par jour Figure : Fichier obtenu partie «Statistiques par Jours et par Type de Personnes» Statistiques liées aux traitements Figure : Fichier obtenu partie «Cumul du Mois» Il est donc indispensable à ce niveau de découper le fichier en trois fichiers différents. Ainsi, nous pourrons construire trois bases contenant toutes les informations présentes dans ce type de fichier XML. Cela nous permet de réaliser un découpage cohérent dans les différentes données statistiques, afin d obtenir des cubes plus ciblés. 259

262 Partie III - Chapitre 8 RUBI 3 RUBICUBE Voici un exemple de fichier créé à partir de la partie «Statistiques par jour». On peut noter le changement des identifiants de colonnes afin de respecter une norme primordiale en base de données, à savoir un nom de champ unique et explicite. Figure : Exemple de fichier retraité partie «Statistiques par Jours et par Type de Personnes» Ce travail de formatage et de traitement des différents fichiers XML a été une étape importante et assez fastidieuse du fait du nombre de fichiers sources. Création des Bases Access En annexes [A6] nous explicitons la démarche utilisée pour générer nos bases Access à partir des fichiers que nous avons retravaillés. A l issue de cette démarche, nous obtenons une base de données contenant toutes les informations que l on a souhaité récupérer. L écran suivant montre une table obtenue à partir d un fichier XML (et plus particulièrement la partie «Statistiques par Jour» cf. Figure ). 260

263 Partie III - Chapitre 8 RUBI 3 RUBICUBE Figure : Exemple de table créée dans Access à partir d un fichier XML via Excel 2003 Nous utilisons également la suite Cognos pour générer un cube Fig et un rapport Fig : Figure : Cube pour les statistiques par jour et par service Figure : Rapport pour les statistiques par jour et par service 261

264 Partie III - Chapitre 8 RUBI 3 RUBICUBE Ces deux types d analyse à l aide de la suite Cognos nous ont permis de faire des analyses très fines au niveau de l emprunt des exemplaires de type de document par type d utilisateur et de procéder à des analyses par jour et par mois des services consultés de l ENT par types d utilisateur. Cependant nous n avons pas pu pousser finement les analyses en croisant des données de consultation du SCD et des données de consultation de l ENT. Nous avons juste pu montrer la faisabilité sur un plan technologique, mais l impossibilité de le mettre en application compte tenu de l aspect organisationnel des systèmes d information. L infaisabilité n est pas uniquement due au fait des principes de confidentialité des données, mais réellement aux données sources ciblées. Nous sommes face à deux entités qui ne catégorisent pas les utilisateurs avec la même finesse Bilan de la phase II de l expérimentation Nous avons travaillé sur des véritables données pour la réalisation d hypercubes avec les difficultés non seulement techniques mais aussi organisationnelles que cela implique. Nous avons constaté les difficultés rencontrées pour collecter les données que ce soit par manque de temps ou par manque d autorisation. En effet, nous avons eu souvent des problèmes de droit d accès à des données qui peuvent être confidentielles ou sécurisées. Le recueil de données, qui constitue la base de ce travail, a pris un temps considérable. Dans la majorité des cas, nous n étions pas autorisés à extraire directement les données d Horizon ou de l ENT. Il a fallu s organiser avec les différents responsables de ces plateformes pour obtenir un maximum de données. Une autre difficulté fut l uniformisation des données. Afin de pouvoir les utiliser dans Cognos, il a fallu faire un travail de mise en forme et de conversion des données, principalement sur les fichiers XML provenant de l ENT. Cela permet de voir que cette étape est très importante dans la construction d un hypercube. Car plus les données sont précises, plus l hypercube s avérera pertinent. L utilisation de nombreux logiciels de traitement de données est aussi une étape importante lors de cette phase d expérimentation. Nous avons constaté la puissance de Transformer qui rend possible la création d hypercube à partir d interrogations ou de tables Access. Mais malheureusement, cela n est vraiment pas le cas pour d autres formats de données comme Excel ou XML. Seule la suite Cognos a été utilisée dans la phase d expérimentation, la suite Openi s est révélée compliquée à installer, puis à exploiter. En effet la structure du cube doit être obligatoirement fondée sur une base de données relationnelle. OpenI est l un des premiers 262

265 Partie III - Chapitre 8 RUBI 3 RUBICUBE outils de création et d analyse de cubes open source. Il est basé sur Mondrian créé en 2002 qui permet de construire et d interroger des cubes OLAP (OnLine Analytical Processing). Il est implémenté en Java et doit donc être installé sur un serveur java de type Tomcat. De plus, il peut utiliser plusieurs types de sources de données : comme une base Mysql, mais aussi compatible avec Oracle et bien d autres. Accessible via un navigateur Internet, cet outil n est disponible uniquement en version anglaise pour le moment. Après avoir exposé l amélioration de notre modèle et expliqué ce que nous entendons par schéma décisionnel, c est cet outil open source que nous utiliserons en Chapitre 9 pour notre application. Nous pouvons déjà avancer que cette expérimentation permet de prendre la mesure des difficultés rencontrées pour la mise en relation des différents systèmes d information de l université. 263

266 264

267 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application 265

268 266

269 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application 9.1. Amélioration du modèle Les deux phases de l expérimentation ont mis en évidence différentes étapes propres à la construction d un entrepôt de données. Il s agit de la «récupération» de données, la spécification de «sources de données existantes», de la phase de «retraitement des fichiers», du «transfert des données», du «reformatage», de la «création d une base» Access, de la «création d un schéma» entité/association, du «requêtage» et de la «création des hypercubes». Riche de nos conclusions pour la réalisation d un entrepôt de données compte tenu de la structuration organisationnelle du système d information de l université, nous pouvons mettre en évidence que notre acronyme RUBICUBE {Récupération, Utilisateur, Besoins, Identification, Classification, Usinage, Bases métiers, Enrichissement} propre à l entrepôt de données mélange des procédés de construction appartenant à des niveaux d élaboration différents du système d information global de l Université. Pour comprendre les objectifs de notre modèle, il ne faut pas focaliser sur la construction de l entrepôt de données, mais intégrer l idée que la réalisation de l entrepôt de données fait partie intégrante du système d information stratégique de l université. La prise en compte de l utilisateur en tant que tel pour la conception d un système d information n est pas un élément nouveau. L originalité réside dans le lien entre les différentes étapes de notre modélisation : comment? Le modèle passe par une phase de conception qui permet l enchaînement des étapes pour offrir des vues à l utilisateur. Les décisions prises par l utilisateur ont des conséquences sur la structure conceptuelle du système. Les vues sont en rapport avec le modèle. Voici un schéma qui explicite le processus de modélisation : M C V U modèle contrôle vue utilisateur Struture conceptuelle Concevoir Enchainement Voir Conséquences Figure : Objectifs du processus de modélisation 267

270 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Ce processus permet de reprendre le modèle RUBICUBE pour l améliorer et le mettre en perspective par rapport à deux niveaux «modélisation» et «application» que l expérimentation nous a permis d identifier : Récupération application Utilisateur modélisation, application Besoins modélisation, application Identification modélisation Classification modélisation Usinage application Bases métiers modélisation Enrichissement application Nous voyons que nous mélangeons des concepts appartenant à des phases différentes de la conception du système d information stratégique. Nous affinons le niveau «modélisation» comme suit : Repérage modélisation Utilisateur modélisation Besoins modélisation Identification modélisation Classification modélisation Usages modélisation Bases métiers modélisation Elaboration modélisation Au niveau «application» correspond un vocable propre aux applications et de niveau plus pragmatique : Récupération application Utilisateur application Besoins application Intégration application Construction application Usinage application Brique application Enrichissement application 268

271 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Pour rendre compte des conséquences sur la structure conceptuelle, il est nécessaire de se placer à un niveau méta que nous nommons «méta modélisation» pour prendre du recul par rapport aux systèmes d information et se rapprocher du système d information stratégique. Cette phase permet la contextualisation des enjeux stratégiques. Référentiel Utilisateur Besoins méta modélisation méta modélisation méta modélisation Interopérabilité méta modélisation Conception méta modélisation Urbanisation méta modélisation Bénéfice Emergence méta modélisation méta modélisation Nous disposons donc d un processus de modélisation autour de trois niveaux «modélisation», «application» et «méta modélisation». Les besoins de l utilisateur, communs aux trois niveaux en constituent le point d intersection ou le pivot, que nous résumons par le modèle RUBI 3 propre à l utilisateur. Nous allons développer les items des trois niveaux. Niveau modélisation de RUBICUBE {Repérage, Utilisateur, Besoins, Identification, Classification, Usages, Bases métiers, Elaboration} Repérage des données : recensement des données existantes, données externes, données internes Utilisateur : représentation de l utilisateur Besoins : fonctions, activités Identification des acteurs : types Classification des acteurs : catégories, sous-catégories Usages des informations : existantes, produites, consultées Bases métiers ciblées acteurs : vues, fouilles de données, analyse Elaboration d une méthodologie : cahier des charges Niveau application de RUBICUBE {Récupération, Utilisateur, Besoins, Intégration, Construction, Usinage, Brique, Enrichissement} Récupération des données : définition des sources d information, des sources de données, des données des logiciels 269

272 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Utilisateur : identification par authentification, interrogation Besoins : recherche d information, production d information Intégration des données : extraction, retraitement des fichiers, transfert des données, reformatage, intégration Construction des indicateurs : déterminer les missions par rapport aux acteurs, déterminer les objectifs de ces missions, sélectionner les indicateurs, tester les indicateurs, construire des tableaux de bord Usinage : choix et mise en œuvre des outils, applications, programmes, quelles sont les applications qui vont utiliser ces données? Outils de vérification de la cohérence et de la fiabilité des données Brique : comment s intégrer au système d information? Et comment ingérer les données en vue d analyse et de prise de décision? Enrichissement du dictionnaire des données : définition des différents niveaux d agrégation des informations, définition des liaisons entre les données Niveau métamodélisation de RUBICUBE {Référentiel, Utilisateur, Besoins, Interopérabilité, Conception, Urbanisation, Bénéfice, Emergence} Référentiel : construction du référentiel de données, création des métas données (descriptives, sémantiques, analytiques, fonctionnelles, structurelles) Utilisateur : rôle sur le système d information stratégique Besoins : métas connaissances obtenues après utilisation du système d information stratégique Interopérabilité : favoriser l interopérabilité des données internes et externes par la prise en compte des protocoles de communication Conception : Définition du modèle du dictionnaire de données, schéma de collecte de l ensemble des informations Urbanisation : définir l infrastructure technique et organisationnelle du système d information stratégique Bénéfice : valeur ajoutée d un système d informations stratégiques, connaissances capitalisées deviennent «intelligibles» et confèrent une «intelligence» au système Emergence : de tendances, d anomalies, d alertes, d améliorations à apporter, d actions à mener 270

273 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application M O D E L I S A T I O N RUBICUBE Repérage Utilisateur Besoins Identification Classification Usages Bases métiers Élaboration A P P L I C A T I O N RUBICUBE Récupération Utilisateur Besoins Intégration Construction Usinage Brique Enrichissement RUBI 3 Représentation Utilisateur Besoins Information Interrogation Identification M E T A M O D E L I S A T I O N RUBICUBE Référentiel Utilisateur Besoins Interopérabilité Conception Urbanisation Bénéfice Émergence Figure : Processus global de la modélisation d un système d information stratégique universitaire avec prise en compte du modèle utilisateur L état de l art sur l expérimentation ainsi que l expérimentation nous a amenée à largement améliorer notre processus de modélisation d un système d information stratégique universitaire. Nous voyons qu en procédant par niveaux, nous pouvons intégrer la modélisation de l utilisateur à toutes les étapes ou phases du processus global de modélisation. Nous allons à présent exploiter ce modèle autour d une application qui est pour nous l occasion de synthétiser les propos amenés tout au long des chapitres de cette thèse et surtout de relever le défi d utiliser un logiciel en open source qui offre des perspectives innovantes quant au traitement du contenu des informations puisqu il repose sur des schémas XMLA pour l analyse des données. 271

274 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application 9.2. Introduction à l application : vers un schéma décisionnel La modélisation des ressources documentaires en chapitre 4, la modélisation des acteurs en chapitre 6 ainsi que la mise en relation du modèle des ressources documentaires et du modèle des acteurs nous avaient conduit à dégager quelques pistes qui constituaient des verrous à exploiter pour améliorer la satisfaction des utilisateurs. Par le rappel de quelques éléments synthétiques de ces précédents chapitres, nous explicitons comment proposer un schéma décisionnel par le recours aux conteneurs d information, à un environnement collaboratif d information et au processus d analyse de l information. Conteneur d information La modélisation des ressources documentaires permet de dégager que la qualité des documents tient également à un ensemble de caractéristiques qui ne sont ni thématiques ni sémantiques, et qui pourtant interviennent dans l évaluation que les utilisateurs font des documents pour décider de leur pertinence. La réputation de l auteur d un document, l actualité et la fiabilité des informations qu il fournit, la clarté du discours, la qualité d illustration du propos, sont autant de critères qui peuvent intervenir lorsqu un utilisateur doit choisir entre plusieurs documents traitant tous du même sujet. L utilisateur doit pouvoir représenter explicitement les connaissances qu il a pu découvrir aux travers de ressources d information. Cette représentation peut être tracée dans des conteneurs de connaissances [CHAMPIN et PRIE, 2002] exploitables par les autres usagers. Environnement collaboratif d information La qualité de l interaction du système avec l utilisateur joue un rôle fondamental dans la conception des systèmes de recherche d information. Cette qualité peut s aborder sous une multitude d angles : la qualité des documents, la précision des résultats, l interaction avec les utilisateurs. La Figure 8.2-1, représentant une constellation de faits, notait l importance de la prise en compte du contexte des utilisateurs lors de la mise en relation entre ressources documentaires et acteurs. Nous ne tenons plus uniquement compte du contenu des documents, mais également des évaluations des documents faites par une communauté d utilisateurs. Cette interaction des utilisateurs entre eux et avec le système d information permet le filtrage collaboratif. On s engage vers un système reposant sur un environnement collaboratif d information. C est un système qui permet d intégrer davantage les «savoir-faire», les connaissances et les 272

275 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application compétences d un groupe d utilisateurs. Le système d information tient davantage compte des besoins en information d un groupe que ce soit pour une recherche synchrone ou asynchrone. Le système est en mesure de prendre en compte les appréciations, les recommandations faites par les utilisateurs d un même groupe. Analyse de l information L analyse de l information couplée à un système de visualisation permet de représenter graphiquement des influences entre différents concepts. Par exemple : l utilisateur «responsable» avant de mettre en place les thématiques d un cursus, prend connaissance rapidement des différentes alternatives qui s offrent à lui et peut analyser les influences entre certains concepts qui l intéressent. La prise de décision s effectue lors de l interaction entre le système et l acteur. Voici un exemple qui permet de visualiser le cheminement de nos idées : Le schéma cidessous met en situation différents acteurs sur un système d information universitaire (étudiants, enseignants, administratifs et responsables). Nous tentons d illustrer la partie invisible qui met en relation différentes bases de données appartenant à des systèmes d information différents. Voici quelques scénaris : Un enseignant dispense un même cours à deux publics d étudiants appartenant à des UFR différentes. Le recours au standard XML [ADAE, 2004] permet d adapter le cours, les exemples, les exercices en fonction des publics "cibles" reconnus après authentification via l annuaire Ldap. L utilisateur, dont le profil est décrit dans des métas données, obtient des informations personnalisées grâce aux feuilles de style XSL [DUCLOY, 2002a]. A un temps T, défini par l enseignant, les corrigés sont visualisables. Parallèlement à l interrogation du système, l utilisateur profilé par les métas données, peut se voir proposer des services supplémentaires via l entrepôt de données. Ces informations complémentaires peuvent concerner des documents électroniques ou des informations économiques et financières. En fonction de son rôle, l utilisateur visualisera des niveaux d information. Par exemple, étudiants et enseignants pourront s informer des changements d emploi du temps ou de salle, avoir des analyses de consultation de cours. L étudiant de licence peut vouloir améliorer ses compétences autour de modules. L étudiant de doctorat pourra accéder à des analyses bibliométriques en vue d enrichir un état de l art. Les administratifs ont des vues 273

276 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application sur des analyses de consultation des services via le web de l ENT. Seuls les responsables auront des vues sur tous les métiers, ceux-ci enrichis de vues sur le coût en personnel, le coût en matériel ou le coût d une discipline. Affichons cet exemple que nous allons commenter sous différents angles et selon les différents protocoles d accès qu ils mettent en œuvre. Nous présentons trois cas de figure : des cours adaptés aux acteurs par les métas données et la structure XML, des bases de connaissances proposées, des analyses permettant la fouille de données. L authentification repose sur le Ldap et permet de proposer des informations adaptées. L accès aux bases de connaissance repose sur une architecture orientée service et les vues métiers sont proposées aux acteurs après identification. cours.xml cours.xsd cours.xsl cours.css Cours Exemple 1 Exemple 2 Visualisation Etudiant type 1 1 Visualisation Enseignant Exercice 1 Exercice 2 Corrigé 1 Corrigé 2 Etudiant type 2 Visualisation Etudiant type 1 Etudiant type 2 Temps : T exemple1.xml exemple1.xsd exemple1.xsl exemple1.css exemple2.xml exemple2.xsd exemple2.xsl exemple2.css Requête Métadonnées Métadonnées 2 authentification 3 Fédération éléments trouvés dans bases de cours <open url> éléments trouvés dans critiques autour d auteurs <biblioml> éléments trouvés dans livres électroniques <open url> éléments trouvés dans bases de données <open url> éléments trouvés dans actualités <RSS> Entrepôt de Données Changement d emploi du temps Changement de salle Coût en personnel Coût matériel Vues métiers Coût d une discipline Analyse consultation des services Analyse consultation des cours Analyse bibliométrique Figure : Illustration des informations proposées par rapport aux profils des utilisateurs au sein d une université 274

277 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Regardons les solutions proposées en corrélation avec les trois pistes dégagées, c est-à-dire l aspect 1 relatif aux métas données, l aspect 2 relatif à l information documentaire pour améliorer la personnalisation des informations et l aspect 3 relatif aux vues métiers adaptées aux acteurs après identification qui fait l œuvre de notre application. 1) Des conteneurs d information vers les métas données Comment par le biais des métas données ajouter de la valeur? Même les données introduites pour identifier et localiser le document primaire sont à repenser dans la mesure où il est possible de mettre en place des systèmes fédératifs comme shibboleth. Pour éviter que les performances des systèmes de recherche d information (SRI) chutent à la fois du point de vue du rappel et de la précision lorsque le document est intégralement accessible, on développe des systèmes de représentation du contenu. La recherche de tendance actuellement consiste à donner du sens. On attend du système qu il trouve un sens global à cette énorme masse d informations plus ou moins contradictoires, en prenant du recul pour faire émerger des informations quantitativement significatives. Une grande proportion de documents numériques est structurée. Ces documents peuvent incorporer dès leur conception des métas informations. La nécessité de compléter les documents eux-mêmes par une méta information se fait de plus en plus sentir. Que doit contenir cette méta information? Le format XML dissocie la structure logique des traitements liés à la sélection et l affichage permet en même temps d effectuer des contrôles syntaxiques sur la structure du document. De quelles informations a besoin l utilisateur dans une perspective de recherche d informations? Le format XML participe à la valeur ajoutée de l information. Reprenons et complétons la Figure pour expliciter comment favoriser l investigation par un enrichissement des documents électroniques à l aide de descripteurs. Par exemple les métas données de la Dublin Core au niveau des documents en HTML et en XML, [DUCLOY, 2002a] permettent plusieurs niveaux de description. Cette activité de description peut être facilitée par l utilisation de DTD existantes comme par exemple BiblioML, XMLMarc, SupXML et de schémas [ADAE, 2004]. 275

278 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application L'enseignant <TITLE>Dublin Core Metadata Élément Set: Resource Page</TITLE> <META name = "DC.subject" content = "dublin core metadata element set"> <META name = "DC.subject" content = "networked object description"> Bases de données de règlements Bases de données de cours A F F I L I A T I O N des arrêtés <descripteur thématique> des cours <descripteur thématique+auteur> Figure : Formalisation des descripteurs Il faut pouvoir chercher des documents électroniques en utilisant à la fois les critères de structure et de vocabulaire. Ceci nécessite que les ouvrages soient stockés avec, en plus de leur texte, la structure de celui-ci. XML change la manière de publier les informations car il donne la priorité au contenu du document plutôt qu à sa structure. Il ne mélange pas l information contenue dans le document et sa présentation. La rédaction du contenu et sa mise en forme correspondant à deux métiers différents, il n est pas logique de les mélanger. Cette séparation du contenu et de la forme permet d extraire des informations du document. Une application peut en effet faire une liste des entrées du répertoire pour les injecter dans une base de données. Voici ci-dessous un exemple à partir des publications de l équipe SITE réimportées dans EndNote puis exportées en XML, puis stylées. Nous trouvons sur le site d EndNote la DTD correspondante. Un document muni d une DTD peut être validé ce qui certifie qu il est conforme à son type. Les DTDs du standard sont cependant relativement pauvres (on ne peut par exemple pas imposer qu un champ soit un nombre entier). 276

279 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application XML Mêmes données Style== DTD XML CSS XSL Figure : Mêmes données de notices bibliographiques en XML stylées de manière différente (liste ou tableau) C est d ailleurs au niveau du langage de DTD que l on détecte les inconvénients du XML. En remplacement, le consortium W3 a fait paraître une recommandation le 2 mai 2001 pour introduire la notion de schéma. 2) De l environnement collaboratif d information vers une conception de l information documentaire Des bases de données vers les bases de connaissances Dans un contexte de collections documentaires homogènes et spécialisées, souvent de taille réduite, la demande prioritaire concerne le rappel : le facteur de satisfaction essentiel est lié au fait d avoir le maximum de chances d obtenir les documents pertinents par rapport à une question, et si possible de retrouver la majorité d entre eux. Il est possible d améliorer le rappel en diversifiant les possibilités de recherche à la fois sur les descripteurs et les chaînes de caractères présentes dans les zones textuelles. Aujourd hui on peut atteindre directement le document primaire en texte intégral, du coup les acteurs de la mise en place des systèmes 277

280 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application documentaires redéfinissent les informations à enregistrer dans les SRI documentaires. Il est utile de repenser les données descriptives du contenu. Production et visibilité des acteurs Parallèlement au problème du contenu des informations, l accent est mis sur la visibilité des acteurs par la prise en compte de l architecture des supports électroniques dans un contexte de production [CHARTRON, 2002]. L objectif est de promouvoir la circulation en réseau de documents électroniques en insistant sur l importance à les structurer pour en accroître leur visibilité et permettre des recherches de type sémantique ou exploratoire. Comment ajouter de la valeur à l information pour augmenter sa visibilité? L information trouvée dépend de la façon dont elle est traitée en amont. Les systèmes de recherche d information reposent sur des bases de données. Leurs performances sont fonction de la façon dont ces bases de données sont enrichies. Architectures orientées services Les architectures orientées services (SOA) permettent d expliquer la nouvelle complexité de la conception d applications distribuées [BOULLIER, 2006]. Interopérabilité, standardisation, démarches de conception plus collaboratives et orientées processus, applications composites, solutions de management des processus (BPM) sont des éléments qui contribuent à modifier l industrie informatique. L informatique se réinvente progressivement en repartant d une conception documentaire de l information. XML en forme le socle omniprésent. L informatique gérait des structures «planes» de l information sous forme de données stockées dans des tables. 3) De l analyse de l information vers un nouveau paradigme informatique Les informations manipulées par les métiers possèdent des structures souvent complexes. Comme nous l avons vu par les fichiers manipulés pour l expérimentation maquettes de cours ou fichiers de log intègrent des notions ayant des dépendances multiples. La récupération des informations s effectue via des requêtes SQL, chacune d elles obtenant en retour des tableaux de données. Le modèle orienté objet a, le premier, mis en évidence ce schisme et la difficulté à manipuler des structures complexes d informations. L approche composant, confrontée à l enjeu de la granularité des services, a échoué face à la difficulté à faire apparaître le niveau de gestion adéquat dans les fonctions implémentées. 278

281 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application L impact de XML apparaît considérable dès 1996 quand ont débuté les premiers travaux autour de la notion d implémentation de document. En février 1998, XML devient une norme du W3C. En dix ans, cette norme documentaire a investi peu à peu le monde de l intégration, puis celui des applications. Les informations structurées et non structurées tendent à se confondre dans les systèmes d information. L impact de XML sur le paradigme informatique se révèle considérable. Les bases de données XML stockent des documents de manière transactionnelle, tout en gardant la capacité de les extraire grâce à de multiples graphes, à l instar des bases relationnelles. Nous appréhendons ce nouveau modèle pour notre application où sera abordé un langage de développement autorisant la manipulation de bases de données en vue d analyses Application avec un produit en open sources OPENI Notre application [MEN, 2001] implique la collaboration de différentes compétences liées aux : métiers des sciences de l information, métiers de l informatique, métiers de l enseignement, métiers autour de la documentation, métiers de l édition électronique [COUZINET, 2005]. L Agence pour le développement de l Administration en Ligne donne le guide de choix et d usage des licences de logiciels libres pour les administrations, produits vers lesquels nous nous tournons pour l application. L intégralité de notre application se trouve sur notre site personnel à ainsi que des guides d installation, de prises en main et d outils. Sourceforgenet openi 1.1 Ce logiciel libre est un outil de reporting open source basé sur Mondrian, destiné à la création et à la publication de rapports. Il s appuie sur J2EE et s attaque aux sources de données Olap (Online Analytical Processing) compatibles XML/A, le langage d accès à ce type de base de données lancé par Microsoft et Hyperion. Le code est téléchargeable gratuitement sur OpenI 1.1 embarque Mondrian, un moteur Olap open source. Les codes sources de ce nouvel outil ont été libérés par Loyalty Matrix. Après une introduction sur les produits open source, nous décrirons la structure de base Mondrian, puis l interface graphique Openi qui permet de définir des profils d accès utilisateur et une interactivité pour l analyse multidimensionnelle. Pour notre application, nous avions deux possibilités de travail. Soit utiliser les binaires, soit travailler avec les sources. Nous avons utilisé les binaires, toutefois nous donnons quelques 279

282 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application informations quant à l utilisation des sources. Les sources sont orientées pour les développeurs Java qui veulent intervenir sur les sources. Dans ce cas Eclipse est un outil très puissant qui vient satisfaire les besoins des développeurs Java : réunir dans une seule application un plan de travail, des outils de gestion de projet en équipe et des fonctionnalités évoluées de débogage. Il offre donc une plateforme de développement particulièrement riche, extensible et ergonomique. Disposant d une palette d outils très étendue, le programmeur peut se concentrer exclusivement sur l écriture de son code. En outre, Eclipse peut être dopé au moyen de nombreux plugins disponibles sur Internet : Tomcat et celui qui nous intéresse pour l administration de modules OLAP : Mondrian. Celui-ci s appelle Mondrian Schema Eclipse Plugin. Ce plugin Eclipse permet d éditer des fichiers XML de schéma OLAP Mondrian Introduction sur l Open Source Le monde de l Open Source, loin d être balbutiant, connaît maintenant une ébullition sans précédent. Dans bien des cas, le produit Open Source se montre supérieur à une offre commerciale et s impose à l utilisateur final. Les éditeurs de logiciels décisionnels libres profitent d un marché en forte croissance et de la refonte des plates-formes propriétaires pour faire valoir leurs atouts. Avec des logiciels dotés de moins de fonctions, et souvent plus abordables, ils visent les entreprises à la recherche de fonctions ciblées. Les développements entrepris sont récents, ce qui contribue à la cohérence du code. L industrie du décisionnel n est pas en reste et l open source propose une offre très riche en la matière. Ces produits peuvent parfaitement s inscrire dans la démarche d un projet pilote à coût très réduit. Au-delà du pilote et moyennant un paramétrage précis, ces outils peuvent aussi s insérer dans une architecture décisionnelle de production. Editeurs et intégrateurs se déclarent tous très intéressés par le développement de nouvelles solutions décisionnelles fondées sur le concept et le modèle économique de l open source. Les fonctionnalités attendues d un système décisionnel digne de ce nom sont les rapports statiques, les rapports dynamiques, la navigation multidimensionnelle et les indicateurs synthétiques. C est dans cette optique que se développe depuis 2002 le projet Mondrian qui permet de construire des cubes OnLine Analytical Processing (OLAP) et de les interroger. 280

283 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Les avantages d une telle application Le principal point fort d un dispositif OLAP résiderait dans la grande souplesse de son mode de requêtage. En fonction des données dont il dispose dans la base sous-jacente, un utilisateur peut commencer par générer une représentation d un chiffre d affaires par produit ou par région puis lui préférer une vue par région et par produit. L opération ne nécessitera que quelques clics. Avec une base multidimensionnelle, il lui suffit en effet de faire pivoter le cube sans pour autant régénérer une requête. Les inconvénients Parce qu elle se doit de pouvoir faire face à l ensemble des besoins d interrogation actuels et futurs d une activité, une couche OLAP est trop souvent construite autour d un nombre exhaustif de dimensions. Une réalité qui se traduit par une application volumineuse et des temps de réponses souvent longs pour l utilisateur final - et ceci même si certains résultats de calcul sont stockés en cache. A la différence de cette stratégie, il est préférable d adopter une démarche de réflexion descendante en vue de sélectionner avec le plus possible de précisions les éléments de la base. Les outils d analyses Parmi les outils d analyse, certains s adressent à un petit nombre d utilisateurs qui sont des décideurs de haut niveau. Leur besoin se tourne vers une analyse poussée qu il est possible d affiner en reformulant la requête. Ces logiciels, qui constituent la spécialité d éditeurs comme Business Objects, sont regroupés derrière le terme «applications analytiques». A l inverse, ceux qui permettent de diffuser les indicateurs vers un périmètre très large d utilisateurs dans l institution entrent dans le cadre du reporting de masse. Le plus souvent, les requêtes sont pré-paramétrées et ne peuvent pas être affinées, l objectif étant de réduire au maximum la charge Introduction du moteur OLAP Mondrian Nous trouverons sur notre site personnel un guide de procédures d installation sous Linux. Pour notre expérimentation, nous avons utilisé une installation sous Windows pour Mondrian et Openi que nous décrivons en annexes [A6]. Dans les bases de données commerciales, les fonctionnalités d un serveur OLAP sont noyées dans un ensemble compact difficile d accès. Dans le monde du libre, ces mêmes fonctionnalités sont disponibles sous la forme d une application séparée accessible facilement. 281

284 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application C est un nouveau mode de fonctionnement que l on découvre peu à peu avec les bases de données multidimensionnelles. L importance de l information et de son traitement accentue ce mouvement, d où la nécessité de développer les applications différemment, notamment par la programmation orientée objet. Mondrian est une application web Java que l on déploie directement sur un serveur web tel que Tomcat. Dans cette partie, nous allons voir ce qu est Mondrian, les couches d un système Mondrian, l installation, la conception d un schéma Mondrian et l utilisation des données de notre expérimentation Présentation de Mondrian Mondrian est un serveur OLAP écrit en Java. Il permet d analyser d une manière interactive des ensembles de données très larges stockés dans des bases de données SQL sans écrire de SQL. Il implémente le langage MDX 133, et le XML pour l analyse et les spécifications JOLAP 134. Il lit depuis SQL et les autres sources de données, et agrège les données dans une mémoire cache Couches du système Mondrian Selon le site officiel du projet Mondrian, un système OLAP Mondrian se compose de quatre couches travaillant depuis l utilisateur final vers le centre des données. Ces couches sont : la couche de présentation, la couche de calcul, la couche d agrégation et la couche de stockage. La couche de présentation détermine ce que l utilisateur final voit sur son moniteur et comment il peut interagir pour effectuer de nouvelles requêtes. Il y a beaucoup de manières de présenter des ensembles de données multidimensionnelles, incluant des histogrammes et des outils de visualisation avancés tels que des cartes cliquables et des graphiques dynamiques. Ils peuvent être écrits en Swing ou Java Script Pages (JSP), les tableaux sortant au format Joint Photographic Experts Group (JPEG) ou Graphics Interchange Format (GIF) ou transmises à une application à distance via XML. Ce que toutes ces formes de présentation ont en commun, c est la «grammaire» multidimensionnelle des dimensions, cellules dans lesquelles la couche de présentation pose la requête et le serveur OLAP retourne la réponse. La seconde couche est la couche de calcul. La couche de calcul analyse, valide et exécute des requêtes MDX. Une requête est évaluée dans des phases multiples. Ce sont d abord les axes 133 MDX : Multidimensional expression language 134 JOLAP : Java Online Analytical Processing 282

285 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application qui sont calculés, puis les valeurs des cellules dans les axes. Un transformateur de requête autorise l application à manipuler les requêtes existantes, plutôt que la construction d une déclaration MDX à partir de rien pour chaque demande. La troisième couche est la couche d agrégation. Une agrégation est un ensemble de valeurs de mesures «cellules» dans la mémoire, qualifiée par un ensemble de valeurs de dimensions colonnes. La couche de calcul envoie des requêtes pour des ensembles de cellules. Si les cellules requises ne sont pas dans le cache, on envoie une requête à la couche de stockage. La couche de stockage est un Relational Database Management System (RDBMS). Elle s occupe de fournir des données agrégées de cellules et les membres des tables de dimension. Ces composants peuvent tous exister sur une même machine ou peuvent être distribués entre plusieurs machines. Les couches 2 et 3, qui comprennent le serveur Mondrian, peuvent être sur la même machine. La quatrième couche est la couche de stockage qui peut être sur une autre machine, accessible via une connexion à distance Java DataBase Connectivity (JDBC). Dans un système multi-utilisateurs, la couche de présentation se trouve sur la machine de chaque utilisateur excepté dans le cas de Java Script Pages (JSP) produites sur le serveur Langage MDX MDX est un langage de requêtes pour les bases de données multidimensionnelles, de la même manière que SQL est utilisé pour les requêtes sur les bases de données relationnelles. A l origine, défini comme une partie de la base de données Object Linking and Embedded (OLE) pour la spécification OLAP et un langage similaire, md extensible Markup Language (mdxml), est une partie du extensible Markup Language (XML) pour la spécification d analyse. Dans son approche le MDX est proche du SQL sur son aspect Select et Where même si la similarité ne va pas plus loin Présentation d un schéma Mondrian D après Mondrian, un schéma définit une base de données multi-dimensionnelle. Il contient un modèle logique constitué de cubes, de hiérarchies, de membres et une projection de ce modèle vers un modèle physique. Le modèle logique est composé de balises utilisées pour écrire les requêtes dans le langage MDX. Le modèle physique est la source des données qui est présentée à travers le modèle logique. C est en général un schéma en étoile qui est un ensemble de tables dans une base de données 283

286 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application relationnelle : une table centrale (table des faits) qui contient les données numériques ayant un intérêt pour les analyses et des colonnes clés étrangères vers les autres tables du modèle. C est à partir de ces autres tables satellites que seront construites les dimensions. Une table des faits est la table centrale du modèle multidimensionnel Application Notre application accessible sur notre site personnel dans le coin «démo» tourne autour de deux volets : la récupération de données externes et la récupération de données en interne. La récupération de données externes offre des analyses pré-calculées. La récupération de données en interne permet des analyses dynamiques. La récupération de données externes concerne les fichiers de «log» de l espace numérique de travail qui propose le nombre de sessions via le web sur les services de l ENT par type d acteurs. Nous récupérons et tirons parti également des données de l analyse bibliométrique exposé dans l état de l art sur l intelligence économique de cette présente thèse pour offrir une analyse dans une interface web et à distance. Ce premier volet permet d expliquer Mondrian. La récupération de données internes concerne notre modèle RUBI 3 et permet le recensement des besoins, des fonctions et des activités par type d acteurs d un SIS universitaire. Ce deuxième volet fait partie intégrante d Openi. Les données externes et internes récupérées et analysées aboutissent à des vues métiers par type d acteur. Avant une explication détaillée dans les paragraphes suivants voici ci-dessous schématisé le scénario de notre application : 284

287 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Données Mysql Moteur OLAP Mondrian MDX requête <schema> <cube> <dimension> <mesure> web RUBI 3 vues métiers Figure : Scénario de notre application Récupération des données (récupération de données externes) La récupération des données a été effectuée en phase 2 de l expérimentation. Les données récupérées en XML concernent les fichiers de «log» de l ENT où nous pouvons distinguer les services de l ENT consultés par type d acteurs. Rappelons qu une annexe [A5] est consacrée à la récupération des données XML via Excel 2003 pour alimenter une base de données Access en MDB. C est à partir de ce travail préparatoire sur les données effectué par les étudiants du Master que nous développons notre application. Ils avaient conclu à la difficulté d utiliser Openi, car il fallait recréer une base de données relationnelle, ce que nous nous employons à faire à présent Transformation des données Pour transformer les données en MDB issues de la base de données Access en données SQL nous utilisons le logiciel MySQL-Front qui offre des fonctionnalités intéressantes au niveau des possibilités d importation que nous ne trouvons pas dans Mysql d Easyphp. Notamment, il est possible d importer des fichiers Sql, des fichiers texte, des fichiers d Access et des fichiers d une table ODBC. ACCESS mdb MySQL Front sql 285

288 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application MySQL Front permet de séparer les données textes et les données numériques. Nous avons donc une base Sql appelée «foodmart» dans laquelle nous avons créé quatre tables. Deux comportent les données textes : «statjour» et «statmois» comme le représentent les schémas ci-dessous : Figure : Données textes de la table statjours Figure : Données textes de la table statmois Les deux autres tables sont les tables de faits qui comportent les données numériques, ainsi que le montrent les deux schémas ci-dessous : Figure : Données numériques de la table de faits jours Figure : Données numériques de la table de faits mois Les cubes Un cube est une collection de dimensions et de mesures dans un secteur particulier et une table des faits lui est associée. La seule chose que les dimensions et les mesures d un cube ont 286

289 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application en commun est la table des faits de ce cube. Un cube peut contenir des dimensions qui lui sont propres et des dimensions partagées. Il crée une dimension en faisant appel à une dimension partagée par une jointure de sa table des faits avec la table de la dimension. Une fois les dimensions créées, on liste les mesures de celui-ci. Une mesure est une quantité qu il est intéressant de quantifier dans ce cube au travers de ses dimensions. Chaque mesure a un nom, une colonne dans la table des faits et un agrégateur. Cet agrégateur peut être une somme, un maximum ou encore une moyenne. Un cube virtuel est défini par la combinaison de dimensions et de mesures appartenant à d autres cubes. Nous avons créé deux cubes nommés «modèle jour» et «modèle mois» dont nous allons expliquer la création. Création du cube «modèle jour» Création de la table «table_fait_jours» La table de faits ne comporte que des données numériques. Il faut établir une base de données relationnelle. A cette phase nous créons des clés secondaires et permettent les relations. Création de la table des dimensions des jours «statjours» des clés primaires qui La table de faits permet de définir des mesures. La table de faits ne contient que des clés secondaires et des données numériques. Table de faits des jours table_fait_jours D i m e n s i o n s Table satellite des jours statjours Clé primaire Mesures Clé secondaire Figure : Cube «modèle jour» Création du cube «modèle mois» Ce cube comprend la création de la table de «faits mois» et la création de la table des dimensions des jours «statjours» 287

290 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Table de faits des jours table_fait_mois D i m e n s i o n s Table satellite des jours statmois Clé primaire Figure : Cube «modèle mois» Schéma Mondrian Mesures Clé secondaire Ce schéma permet de définir une base de données multidimensionnelle. C est un fichier extensible Markup Language (XML) nommé FoodMart.xml. Dans le schéma FoodMart on trouve les dimensions partagées puis différents cubes, un cube virtuel et les rôles. Les dimensions partagées Les dimensions peuvent être créées de deux manières. La première est de créer les dimensions à l intérieur d un cube. Dans ce cas ces dimensions ne pourront pas être utilisées pour un autre cube. La deuxième est de créer une dimension pour un ensemble de cubes que l on appelle dimension partagée. Une table dimensionnelle est alors créée pour cette «dimension partagée». Un cube ajoutera cette dimension aux siennes en faisant une jointure de sa table des faits avec la table de cette dernière. Les rôles Un rôle est défini grâce à la balise placée juste après la définition du dernier cube. Il sert à définir un accès particulier pour une personne particulière. Les membres et la propriété des membres On définit la propriété d un membre appartenant à un niveau. On donne au membre un nom et la colonne de la table des faits qui lui correspond. Les membres calculés Les membres calculés sont des membres qui ne viennent pas directement d une colonne de la table des faits mais sont issus d une formule MDX. 288

291 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Les tables agrégées Les tables agrégées sont le meilleur moyen d améliorer les performances de Mondrian quand la table des faits contient un nombre très important de lignes : un million et plus. Une table agrégée est concrètement un sommaire pré-calculé des données de la table des faits. Nous allons expliquer le schéma Mondrian de «modèle_jours» test que nous venons de créer. Ce schéma permet de définir une base de données multidimensionnelle. C est un fichier extensible Markup Language (XML) nommé FoodMart.xml. Dans ce schéma FoodMart on trouve les dimensions, les mesures et le cube «modèle_jours». 3 d i m e n s i o n s 6 mesures <Cube name= «modele_jours»> <Table name= «table_fait_jours»/> <Dimension name= Acteur foreignkey= jour_id > <Hierarchy hasall= true primarykey= jours_id > <Table name= statjours /> primarykey= jours_id ><Level name= Acteur column= personne uniquemembers= true /> </Hierarchy> </Dimension> <Dimension name= Service foreignkey= jours_id > <Hierarchy hasall= true primarykey= jours_id > </Hierarchy> </Dimension> <Table name= statjours /> <Level name= Service column= service uniquemembers= true /> <Dimension name= Jour foreignkey= jour_id > <Hierarchy hasall= true primarykey= jours_id > </Hierarchy> </Dimension> </Cube> <Table name= statjours /> Figure : Schéma Mondrian <Level name= Jour column= jour type= Numeric uniquemembers= true /> <Measure name= servcalls column= servcalls aggregator= sum formatstring= # /> <Measure name= nbusersserv column= nbusersserv aggregator= sum formatstring= # /> <Measure name= nbusers column= nbusers aggregator= sum formatstring= # /> <Measure name= allsserv column= allsserv aggregator= sum formatstring= # /> <Measure name= nbusersperso column= nbusersperso aggregator= sum formatstring= # /> <Measure name= nbservicescallsperso column= nbservicescallsperso aggregator= sum formatstring= /> Nous avons défini 3 dimensions qui ont pour nom Dimension name= «Acteur» et Dimension name= «Service» et Dimension name= «Jour», elles sont composées d une seule hiérarchie. L option «hasall = true» crée un niveau «all» qui a pour seul membre le membre «all» qui est au-dessus de tous les autres niveaux de la hiérarchie est qui permet d englober tous les membres de cette hiérarchie. Ce membre est le membre par défaut de cette hiérarchie. Dans le cas où l option «hasall=false» est choisie, c est le premier membre du premier niveau qui est 289 Table des faits CUBE modele_jours

292 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application le membre par défaut. La table associée à ces hiérarchies est <Table name= «statjours»/> qui a pour clé primaire primarykey= «jours_id»>. La hiérarchie est constituée d un niveau par dimension : Level name= «Acteur», Level name= «Service», Level name= «Jour». Chacun de ces niveaux fait intervenir une colonne de la table_fait_jours. Requêtes MDX : SELECT [<axis_specification> [, <axis_specification>...] FROM [<cube_specification>] La spécification d un axe doit être SET suffixé du mot clef ON suivi du nom d axe, par exemple tiré du fichier xmla.jsp. Statmois Table_fait_mois Figure : Correspondant entre la table de faits et la table satellite SELECT {[Acteur].[etudiant]} ON columns, {[Measures].[nbusers]} ON rows FROM modele_mois A partir du cube modele_mois nous faisons une recherche sur les colonnes de l item étudiant qui se trouve dans la dimension Acteur. Sur les lignes nous faisons une recherche dans la colonne nbusers pour effectuer une mesure. Voici une copie d écran représentant sous Mondrian un cube par mois du nombre de consultations de l acteur étudiant des services de l ENT : 290

293 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Figure : Cube sous Mondrian L orientation définitivement axée sur les préoccupations fonctionnelles du MDX, en font un langage permettant d écrire rapidement et de manière compacte n importe quelle question métier. De prime abord, le MDX possède une syntaxe un peu ardue. Néanmoins le temps que nous passons à son assimilation est largement compensé par celui que nous gagnons lors de l écriture des requêtes du langage SQL. Si l utilisation interactive des cubes est intéressante, leur structure multidimensionnelle associée à la puissance de ce langage en fait des outils de prédilection pour le reporting opérationnel d entreprise ou d administration. Au-delà de cet aspect, le MDX permet d explorer les données des cubes et crée la vraie valeur autour des données et c est ici que se trouve la plus value. Il n en reste pas moins que le MDX reste un langage, qui n est pas forcément simple à appréhender. Des éditeurs commencent à proposer des outils multidimensionnels. Récupération de données externes : suite Pour enrichir notre application nous avons ajouté un projet qui reprend l analyse de l état de l art, c est-à-dire l étude autour des secteurs de l'intelligence économique faisant l œuvre d'événements par le dépouillement de listes de diffusion en 1.7. Nous avons repris exactement les mêmes étapes que pour la récupération des fichiers de log en Nous avons construit et introduit dans Mysql une table de faits nommée «table_fait_synt» et une table satellite 291

294 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application appelée «synthese». Nous avons complété notre schéma Mondrian d un cube nommé «synthese» et définissons des dimensions et des mesures. L originalité de ce projet réside dans l analyse de termes et non plus seulement de données chiffrées. Voici le cube rajouté au schéma mondrian : <Cube name="synthese"> <Table name="table_fait_synt"/> <Dimension name="evenement" foreignkey="id_fait_synt"> <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese"/> <Level name="level2" column="evenements" uniquemembers="true"/></hierarchy></dimension> <Dimension name="theme" foreignkey="id_fait_synt"> <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese"/> <Level name="level1" column="themes" uniquemembers="true"/></hierarchy></dimension> <Dimension name="secteur" foreignkey="id_fait_synt"> <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese"/> <Level name="level3" column="secteur" uniquemembers="true"/></hierarchy></dimension> <Dimension name="objectif" foreignkey="id_fait_synt"> <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese"/> <Level name="level4" column="objectifs" uniquemembers="true"/></hierarchy></dimension> <Dimension name="date" foreignkey="id_fait_synt"> <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese"/> <Level name="level5" column="date" uniquemembers="true"/></hierarchy></dimension> <Dimension name="organisateur_type" foreignkey="id_fait_synt"> <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese"/> <Level name="level6" column="organisateur_type" uniquemembers="true"/></hierarchy></dimension> <Dimension name="organisateur_specialite" foreignkey="id_fait_synt"> <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese"/> <Level name="level7" column="organisateur_specialite" uniquemembers="true"/></hierarchy></dimension> <Measure name="mesure 1" column="id_themes" aggregator="sum" formatstring="#"/> <Measure name="mesure 2" column="id_evenements" aggregator="sum" formatstring="#"/> <Measure name="mesure 3" column="id_secteur" aggregator="sum" formatstring="#"/> <Measure name="mesure 4" column="id_objectifs" aggregator="sum" formatstring="#"/> <Measure name="mesure 5" column="id_date" aggregator="sum" formatstring="#"/> <Measure name="mesure 6" column="id_organisateur_type" aggregator="sum" formatstring="#"/> <Measure name="mesure 7" column="id_organisateur_specialite" aggregator="sum" formatstring="#"/></cube> Introduction à l interface graphique Openi (récupération de données internes Openi repose sur le moteur OLAP mondrian que nous venons d expliciter. Quels sont les avantages apportés par Openi? Openi offre un éditeur MDX avec une génération automatique de code lors de la création des analyses. Il offre une gestion des projets. 292

295 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Cubes authentification Getion des projets Figure : Environnement graphique d analyse et de gestion d Openi Une authentification par login et mot de passe permet de proposer différentes vues selon le profil de l acteur qui se logue. Notre méthodologie de classification des acteurs permet de définir des groupes et des sous-groupes d acteurs selon leur catégorie et sous-catégories comme nous l avons montré en figure qui modélise les types d acteurs. La représentation des acteurs selon (RU=T,B,F,A) permet de définir des items par type d acteurs et de mettre en évidence des groupes d acteurs autour des besoins, des fonctions et des activités selon la figure suivante : Figure : Items et groupes d acteurs selon RU=(T,B,F,A) Ces groupes d acteurs ont des rôles qui leur donnent accès à des rubriques et des sousrubriques du Système d Information Stratégique comme le montre la figure ci-dessous : 293

296 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Figure : Rôle des acteurs sur le SIS universitaire et conséquences sur les vues métiers Ces accès personnalisés offrent des vues métiers par type d acteurs. A partir des rôles définis pour les groupes d acteurs nous créons des profils d utilisateurs qui sont dans notre application : «responsable», «administratif», «étudiant», «enseignant» et «administrateur». La récupération des données internes s opère à travers l interface d Openi. Pour effectuer l intégration et l analyse de données de façon dynamique, nous avons choisi notre modèle RUBI 3 pour le tester. RUBI 3 imbriqué permet de faire le recensement des besoins, fonctions et activités par type d acteur. Dans la conception de notre application, chaque acteur peut enregistrer lui-même les items prédéfinis, sachant que les items qui s afficheront seront fonction de son rôle après son authentification. Responsable et administrateur disposeront du même formulaire d enregistrement et auront à leur disposition la totalité des items de tous les acteurs. Les enseignants verront les items des acteurs «enseignant», «administratif» et «etudiant». Les administratifs disposeront des items des acteurs «administratif» et «etudiant». Les étudiants ne verront et ne pourront remplir que les items «etudiant». Ci-dessous nous présentons le formulaire comportant la totalité des items à destination de tous les acteurs et donc accessibles aux acteurs «responsable» et «administrateur» du système d information stratégique. 294

297 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Items Figure : Formulaire de recensement élaboré à partir de RU=(T,B,F,A) Ce formulaire récupère des données via un script mysql pour alimenter une base de données mysql nommée «ma_table» et crée une table de faits appelée «ma_table_fait». Nous enrichissons notre schéma Mondrian en vue d analyses d un cube consacré aux données du formulaire à analyser : <Cube name="stat"> <Table name="ma_table_fait"/> <Dimension name="enseignant" foreignkey="id_cle"> <Hierarchy hasall="true" primarykey="id_cle"> <Table name="ma_table"/> <Level name="toto" column="enseignants" uniquemembers="true"/></hierarchy></dimension> <Dimension name="act_enseig" foreignkey="id_cle"> <Hierarchy hasall="true" primarykey="id_cle"> <Table name="ma_table"/> <Level name="act_enseig" column="act_enseig" uniquemembers="true"/></hierarchy></dimension> <Dimension name="fonct_enseig" foreignkey="id_cle"> <Hierarchy hasall="true" primarykey="id_cle"> <Table name="ma_table"/> <Level name="fonct_enseig" column="fonct_enseig" uniquemembers="true"/></hierarchy></dimension> <Measure name="sans_infos_enseignants" column="sans_infos_enseignants" aggregator="sum" formatstring="#"/> <Measure name="professeur_enseignants" column="professeur_enseignants" aggregator="sum" formatstring="#"/> <Measure name="eneig_cherc_enseignants" column="eneig_cherc_enseignants" aggregator="sum" formatstring="#"/></cube><role name="california manager"> 295

298 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Ci-desssous, nous explicitons par un organigramme le script régissant le formulaire de saisie et de récupération des données : Création de ma_table Crée un clône de ma_table renommée en ma_table_inter Affectation d un numéro par item dans ma_table_inter Chaque item de chaque type d acteur T, B, F, A Crée ma_table_fait Crée un numéro d identification pour besoins, fonction et activités Crée les items T, B, F, A Nettoyage de données inutiles Sélection, récupération, stockage de données intermédiaires dans fichiers temporaires T, B, F, A Insertion des données dans les colonnes de ma_table_fait qui contient les items Remise en conformité au niveau du comptage Figure : Organigramme du script RUBI 3 en mysql Ce formulaire alimente en temps réel la base SQL et permet à l acteur de faire ses propres analyse par requête MDX dans un environnement facilité grâce à l interface graphique d Openi. Il est possible de modifier les requêtes MDX générées par Openi et restituées dans une fenêtre. L utilisateur peut ensuite choisir les types de graphes les mieux appropriés pour mener ses analyses multidimensionnelles et pratiquer la fouille de données. Nous proposons un écran qui représente une analyse faite par un enseignant après avoir rempli son formulaire ainsi que la requête MDX correspondante qui apparaît automatiquement et sur laquelle l enseignant peut intervenir aisément : 296

299 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application MDX Figure : Analyse dynamique des données du formulaire faite par l utilisateur néophyte En conclusion, notre application a pu être réalisée car elle vient au terme d une modélisation complexe qui s est effectuée en plusieurs étapes. Les phases consacrées à la théorie, une méthode, une première proposition d un modèle, l expérimentation ont participé au processus de modélisation. L expérimentation permettait de valider ou d invalider certaines de nos propositions et a permis d améliorer le modèle. Par l application nous avons pu traiter des données externes et internes et tester notre contribution. Nous montrons qu il est possible d analyser des données chiffrées mais également des expressions. La contextualisation des données et des acteurs de l université offre en retour après authentification sur le système d information des vues ciblées qui favorisent les prises de décisions. Nous montrons par notre processus de modélisation et notre application que le SI de l université orienté acteur est en mesure d être un SIS universitaire Résumé de la troisième partie La troisième et dernière partie aborde différents domaines : concepts, application, expérimentation, hypercubes, entrepôt, informations stratégiques, services, bases de données, gestion fichiers, acteurs, création, data warehouse, architecture, phases, modélisation. 297

300 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application Nous nous appuyons sur l entrepôt de données pour exploiter notre modèle RUBI 3 propre à l'utilisateur en tenant compte du contexte d'un système d'information stratégique universitaire. Ce processus expérimental permet d'améliorer la modélisation d'un système d'information stratégique universitaire pour lequel nous identifions plusieurs niveaux à prendre en compte lors de sa conception. Le modèle sert de point d'ancrage pour une expérimentation en deux phases. Les résultats de l'expérimentation font émerger des notions qui favorisent la déclinaison de l'acronyme RUBICUBE propre à la conception du système d'information stratégique universitaire en tenant compte du contexte de l'utilisateur et de ses spécificités. D après Franco, l'architecture de l'entrepôt de données comporte trois niveaux fonctionnels essentiels : le niveau acquisition des données, le niveau stockage des données et le niveau analyse de données. L'entrepôt de données doit intégrer les données les unes avec les autres afin d'assurer une cohérence sémantique globale. Il se compose d'un data warehouse, de bases de données multidimensionnelles ou hypercubes et d'un ensemble d'outils permettant l'alimentation du data warehouse, son interrogation et la production de rapports, l'extraction intelligente des données par techniques de data mining enfin l'analyse décisionnelle pour réaliser le pilotage de l'organisation. Un SIS reposant sur du data mining est en fait pour nous l'ensemble des outils ayant pour objet d'extraire des connaissances à partir des données de l'institution. Cela permet par exemple de dégager des profils des utilisateurs et de leurs besoins types afin de prévoir les services à mettre à leur disposition. Cet état de l'art au service de notre expérimentation montre l'intérêt à envisager un SIS reposant sur un entrepôt. Nous constatons que les différents services de l'université disposent plutôt d'infocentres que de réels systèmes orientés vers la prise de décision. Même si dans les services publics de l'université, certains acteurs font de l'intelligence économique sans le savoir, il n'y a aucun service identifié comme tel dans l'université. Pour modéliser les ressources électroniques nous sommes partis des normes et des standards que nous avons enrichis pour être en mesure de proposer des classes d'objets. Cette étape met en relief les éléments qui nous permettent de corréler acteurs et ressources documentaires. Ce processus d'anticipation vient compléter et non se substituer à l'environnement proposé lorsque l'acteur interroge le système d'information après authentification. Une première expérimentation permet de construire un hypercube à partir des maquettes Excel fournies par l'ufr MI en tenant compte des différents acteurs (étudiant, enseignant, directrice de l'ufr MI et l'université). Ces hypercubes sont exploités par la création des rapports qui répondent aux différentes questions que se pose chaque acteur. Nous nous 298

301 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application appuyons d'une part sur le processus de modélisation de l'utilisateur et sur le processus de modélisation de création d'un entrepôt de données pour la réalisation de cette expérimentation. La seconde expérimentation permet de récupérer un maximum de données brutes à partir de deux sources et de les retravailler afin de pouvoir les exploiter dans un cube. L'ENT fournit à travers des fichiers XML, des données générales sur les recherches effectuées sur la plateforme. L expérimentation consiste à trouver un moyen de construire un hypercube à partir de fichiers XML fournies par l'ent et de fichiers Excel provenant du SCD. Nous avons travaillé sur des véritables données pour la réalisation d'hypercubes avec les difficultés non seulement techniques mais aussi organisationnelles que cela implique. Nous avons constaté les difficultés rencontrées pour collecter les données. Seule la suite Cognos a été utilisée dans la phase d'expérimentation, car la suite Openi s'est révélée compliquée à installer, puis à exploiter car la structure du cube doit obligatoirement reposer sur une base de données relationnelle. Après avoir exposé l'amélioration de notre modèle et expliqué ce que nous entendons par schéma décisionnel, nous utilisons un produit en open source pour réaliser notre application. Les deux phases de l'expérimentation ont mis en évidence différentes étapes propres à la construction d'un entrepôt de données. Riche de nos conclusions pour la réalisation d'un entrepôt de données compte tenu de la structuration organisationnelle du système d'information de l'université, nous pouvons mettre en évidence que notre acronyme RUBICUBE Récupération, Utilisateur, Besoins, Identification, Classification, Usinage, Bases métiers, Enrichissement propre à l'entrepôt de données mélange des procédés de construction appartenant à des niveaux d'élaboration différents du système d'information global de l'université. L'originalité réside dans le lien entre les différentes étapes de notre modélisation : comment? Le modèle passe par une phase de conception qui permet l'enchaînement des étapes pour offrir des vues à l'utilisateur. Pour rendre compte des conséquences sur la structure conceptuelle d un SIS nous avons mis en évidence un niveau modélisation, un niveau application et un niveau méta modélisation. Nous exploitons ce modèle autour d'une application qui est pour nous l'occasion de synthétiser les propos amenés tout au long des chapitres de cette thèse et surtout de relever le défi d'utiliser un logiciel en open source qui offre des perspectives innovantes quant au traitement du contenu des informations puisqu'il repose sur des schémas XMLA pour l'analyse des données. Les systèmes de recherche d'information reposent sur des bases de 299

302 Partie III - Chapitre 9 Amélioration du modèle et son exploitation pour une application données. Les bases de données XML stockent des documents de manière transactionnelle, tout en gardant la capacité de les extraire grâce à de multiples graphes, à l'instar des bases relationnelles. Nous appréhendons ce nouveau modèle pour notre application où est abordé un langage de développement autorisant la manipulation de bases de données en vue d'analyses. Ce logiciel libre est un outil de reporting open source basé sur Mondrian, destiné à la création et à la publication de rapports. Il s'appuie sur J2EE et s'attaque aux sources de données Olap (Online Analytical Processing) compatibles XML/A, le langage d'accès à ce type de base de données. MDX est un langage de requêtes pour les bases de données multidimensionnelles. 300

303 Conclusion et perspectives 301

304 302

305 Conclusion et perspectives Pour conclure nos travaux de recherche de notre thèse sur la modélisation de l utilisateur par rapport à un système d information universitaire nous pouvons dire que l organisation même des neufs chapitres en trois parties nous a grandement facilité nos réflexions pour répondre à l hypothèse de départ, en nous référant à notre problématique posée au début de la recherche et en ciblant les enjeux spécifiques à notre problématique. Avant de poursuivre la conclusion rappelons notre hypothèse, notre problématique et nos enjeux. L hypothèse de notre étude consistait à montrer que, si nous recourions à la modélisation des utilisateurs en amont de la conception d un système d information, nous aboutirions à une amélioration de la satisfaction des usagers du système d information. Cette hypothèse s applique dans un cadre universitaire. Notre problématique était formulée selon les questions suivantes : «Entreprendre une démarche d intelligence économique dans l amélioration d un système d information permetil d améliorer les prestations offertes aux usagers d une université et d optimiser les services afin d arriver à satisfaire ses utilisateurs?» et «Comment intégrer la représentation de l utilisateur dans un système d information stratégique universitaire?». Cette problématique a guidé notre démarche pour atteindre les objectifs définis dans notre hypothèse de départ. Nous avions remarqué plusieurs enjeux qui vont en faveur de la spécification de notre problématique. Les étudiants ont pour but de réussir, apprendre mieux, autrement, efficacement par la construction d un projet professionnel qui doit les aider à trouver un emploi. L enseignant passe du rôle d enseignant à celui d auteur. Les administrations gagnent à diffuser et partager les informations pour résoudre des problèmes, échanger des points de vue, reproduire ou innover. Par ailleurs, nous constations que l usage qui est fait de l information trouvée reste le point aveugle ; cette constatation nous orientait vers la proposition d un système d information où l acteur évolue dans un système d information collaboratif. Pour démontrer notre hypothèse nous nous appuyons sur un processus d intelligence économique pour faire évoluer un système d information universitaire en un système d information stratégique universitaire et apporter des solutions à notre problématique. Après un état de l art sur l intelligence économique, les systèmes d information et les acteurs nous avons alors pu affiner nos champs de recherche et aborder notre contribution. 303

306 Conclusion et perspectives Par notre contribution nous avons mis en relief que la conception d un système d'information stratégique nécessite une démarche de conception particulière et une modélisation complexe. Notre étude sur les fonctions, les usages et les besoins des utilisateurs participe à la représentation de l utilisateur du système d information universitaire. La classification des utilisateurs selon leurs activités sur le système aboutit à des constatations qui les font passer au rang d «acteurs». L université est notre domaine d application : ses composants constituent des concepts de base. La modélisation des ressources documentaires et la modélisation des utilisateurs ont été nos objets de recherche. Ils constituent des concepts manipulés. De façon pragmatique «théorie», «méthode» et «modélisation» nous ont permis de caractériser nos objets de recherche. Par la «théorie», nous avons démontré l hypothèse de notre problématique. Nous pouvons confirmer que si nous prenons en compte un certain nombre d éléments propres à l utilisateur en amont de l urbanisation d un SI, nous travaillons à une meilleure satisfaction de l usager. Notre étude théorique à partir d un système de classification des acteurs a fait émerger des besoins, des fonctions et des activités propres à des types d acteurs d un système d information. Nous avons dans un premier temps proposé de représenter l utilisateur ainsi : RU = (T,B,F,A) où T est le type d acteur, B sont les besoins, F sont les fonctions et A sont les activités des acteurs. Ce mode de représentation était en quelque sorte une étape intermédiaire nécessaire avant de pouvoir aboutir à un modèle. La «méthode» correspondait à une phase plus pragmatique qui nous a permis de lister, compter, classifier des éléments propres à nos objets de recherche pour en faire émerger des caractéristiques. La «modélisation» s est appuyée sur les deux phases précédentes pour réduire ou transformer les objets de nos recherches à une taille gérable pour représenter la réalité. Nous avons pu aboutir à la proposition d un modèle RUBI 3 {Représentation des Utilisateurs et de leurs Besoins en Information lors de l Interrogation après Identification}. L'originalité de notre contribution réside dans le lien entre les différentes étapes de notre processus de modélisation. Notre contribution formalisée par notre modèle a fait l œuvre d une expérimentation afin d évaluer les résultats de nos recherches. Après avoir présenté un 304

307 Conclusion et perspectives état de l art de l expérimentation, nous avons utilisé l outil entrepôt de données qui fait partie intégrante du système d information stratégique de l université pour effectuer nos analyses. Le modèle sert de point d'ancrage pour notre expérimentation. Nous nous appuyons sur l entrepôt de données pour exploiter notre modèle RUBI 3 propre à l'utilisateur. L expérimentation met en relief les difficultés non seulement techniques mais aussi organisationnelles qu implique la construction d un entrepôt avec la prise en compte du contexte global de l université. L'expérimentation met en évidence différentes étapes propres à la construction d'un entrepôt de données que nous représentons par l'acronyme RUBICUBE Récupération, Utilisateur, Besoins, Identification, Classification, Usinage, Bases métiers, Enrichissement. Ce processus expérimental permet d'améliorer la modélisation d'un système d'information stratégique universitaire pour lequel nous identifions plusieurs niveaux à prendre en compte lors de sa conception. Les résultats de l expérimentation ont favorisé l amélioration du modèle. Riche de nos conclusions pour la réalisation d'un entrepôt de données compte tenu de la structuration organisationnelle du système d'information de l'université, nous avons pu mettre en évidence que notre acronyme RUBICUBE propre à l'entrepôt de données mélangeait des procédés de construction appartenant à des niveaux d'élaboration différents du système d'information global de l'université. Pour rendre compte des conséquences sur la structure conceptuelle d un SIS nous avons alors décliné RUBICUBE selon : un niveau modélisation, un niveau application et un niveau méta modélisation. Après avoir exposé l'amélioration de notre modèle et expliqué ce que nous entendions par schéma décisionnel, nous avons utilisé un produit en open source pour réaliser notre application. Nous exploitons notre modèle {RUBI 3 <->RUBICUBE} autour d'une application qui est pour nous l'occasion de synthétiser les propos amenés tout au long de notre thèse et de relever le défi d'utiliser un logiciel en open source qui offre des perspectives innovantes quant au traitement du contenu des informations puisqu'il repose sur des schémas XMLA pour l'analyse des données. Nous appréhendons ce nouveau modèle pour notre application où est abordé un langage de développement autorisant la manipulation de bases de données en vue d'analyses. Nous avons prouvé que nous pouvions analyser des données chiffrées mais également des données textuelles. Grâce à la description des ressources documentaires inspirée en partie des observations de la «millenial generation» identifiée au mouvement «connectivisme» en situation de jeu et 305

308 Conclusion et perspectives complétée par l analyse des normes et des standards de description de documents, nous avons pu proposer un modèle original de mise en relation des données et des acteurs qui consiste à agréger un profil à une ressource documentaire. Dans notre conception du système d information stratégique reposant sur un entrepôt de données la description du document devient si fine que le document lui-même devient un «acteur» du système comme en témoigne notre figure «Prise en compte du contexte des utilisateurs» qui résume le cœur de nos recherches et permet par une constellation de faits la convergence des données. Dans l immédiat nous développons un nouveau projet à insérer dans Openi à partir de la mise en place d un formulaire de recensement des descriptions de document, qui est une réplique du formulaire du recensement des besoins des utilisateurs, pour construire un cube en vue d analyses. Nos perspectives à court terme concernent la mise en relation des deux cubes «recensement des descriptifs des documents» et «recensement des besoins des acteurs» pour permettre par le biais d un hypercube de finaliser notre application. Nos perspectives à plus long terme concernent le format des bases de données utilisé dans notre application. Pour synthétiser notre application, seule la partie «analyse des données» repose sur un schéma d analyse en XMLA. Pour tous les projets dans Openi, nous avons dû importer nos données dans une base SQL alors que nous disposions de données en XML! C est pourquoi nous comptons orienter une partie de nos recherches pour permettre à un schéma en XMLA de procéder à des analyses de données issues de bases de données en XML. Notre contribution a permis de prouver que l on peut tirer parti des données sous-jacentes à un système d information, que ce soit des données chiffrées, financières, documentaires ou pédagogiques pour en faire des données «intelligentes» qui favorisent l analyse, l émergence de tendances par et pour les acteurs experts de leur propre domaine. Nous démontrons que le processus d intelligence économique permet de dépasser le cadre des «infocentres» répartis dans différents services de l université pour proposer un système d intelligence économique orienté vers la prise de décision. Notre modèle appliqué {RUBI 3 <->RUBICUBE} symbolise une image fractale et fait écho en guise de réponse aux propos d Alain Juillet [JUILLET, 2004], représentant de l'intelligence Economique au sein de l'etat, qui constate que l Intelligence Economique manque d outils français ou européens performants. 306

309 Annexes 307

310 308

311 [A1] Annexes : Résultat du dépouillement des listes ( ) [A1] Premier tableau analytique réalisé après dépouillement des listes de diffusion et groupes de discussion consacrés à l intelligence économique pour permettre la réalisation de tableaux synthétiques autour d indicateurs en vue d une fouille de données. Evénement Date Lieu Site dédié Organisateur Jeudi 14 décembre 2000 à 14h ADEST Association pour la mesure des sciences et des techniques Objectifs V. S. S. T Veille Stratégique Scientifique & Technologique Objectifs Prospective et stratégie des entreprises dans l économie de la société de l information et de la communication. L Ecole des Mines, 60 bd St- Michel, Paris 309 Animateur : Jean- Max Noyer Interventants : GENERAL JEAN GUYAUX. Les enseignements de la tradition du renseignement militaire appliqués à l intelligence économique Saïda Bédar /cirpes La dominance informationnelle comme problème : l exemple américain. La réforme stratégique américaine, vers une révolution militaire? A partir de la question suivante : «En quoi l information est-elle aujourd hui un objet stratégique surdéterminant?», l intervenante présentera la réforme stratégique américaine comme expérimentale et systémique. Au delà des échelles tactiques et de l intégration des technologies de l information, elle montrera qu au niveau stratégique, cette intégration n est plus seulement informationnelle mais qu elle est aussi civilo-militaire au sens le plus large (civilianization) et ce, selon deux processus parallèles. La «Révolution in Business Affairs» d une part et l intégration décisionnelle civilo-militaire d autre part. La question des nouvelles formes organisationnelles impériales étant ainsi posée Octobre 2001 BARCELONE Co-organisé par: la Fondation Polytechnique de Catalogne (FPC), l Institut de Recherche en Informatique de Toulouse (IRIT), la Société Française de Bibliométrie Appliquée (SFBA). Le colloque VSST 2001 est organisé pour présenter des travaux de recherche et de développement industriel innovants dans le domaine des systèmes de Veille Stratégique Scientifique et Technologique. Les données scientifiques et techniques, qu elles soient textuelles ou factuelles, formelles ou informelles, constituent des mines d informations stratégiques aussi bien pour les décideurs (intelligence économique, veille concurrentielle) que pour les chercheurs et les ingénieurs (veille scientifique et technologique). Cependant, devant la masse croissante d information, les organismes ont besoin de systèmes d aide à l analyse de plus en plus performants. Ces systèmes doivent offrir des possibilités d exploration très fine et de représentation synthétique de l information recueillie et des nouvelles connaissances déduites. En amont, ils doivent assurer la collecte, la sélection et le filtrage de l information électronique disponible dans des bases spécialisées internes, externes et sur Internet, ainsi que la prise en compte des données informelles collectées, sur le terrain, par les différents acteurs de la veille. En aval, pour la restitution des résultats, ils doivent privilégier l ergonomie dans les fonctions de présentation, de navigation et de synthèse. Dans cette troisième édition du colloque VSST, un intérêt tout particulier sera accordé aux méthodes et applications qui garantissent une exploitation efficace des grandes masses de documents et qui sont porteuses d une réelle plus-value informationnelle. 29 mars 2001 de 9h à 17h30 Université Jean Moulin Lyon III, Lyon Journée d étude organisée par DocForum avec Futuribles, et animée par Hugues de Jouvenel, délégué général de

312 310 [A1] Futuribles International, et André-Yves Pornoff, directeur de l Observatoire de la révolution de l intelligence à Futuribles International. Objectifs Au cours de ce séminaire seront abordés les thèmes suivants : Prospective et intelligence stratégique Le nouveau paradigme technico-économique La révolution de l intelligence et le management de l immatériel Quelle organisation efficace dans la net-économie? Ces journées offrent une information régulière sur l évolution des technologies et des savoir-faire dans la société de l information. De manière synthétique, elles apportent bases conceptuelles, méthodes et outils que chaque professionnel doit connaître dans les domaines abordés. Elles permettent des échanges d expériences et enrichissent l expertise de chacun. Très opérationnelle, chaque journée d études est organisée avec un expert du domaine, un organisme professionnel ou universitaire qui assurent la qualité scientifique. Journée consacrée aux outils intelligents Objectifs 24/04/01 8h30 à 19h. ISKO-France 5 et 6 juillet 2001 Objectifs Ecole Supérieure d Ingénieurs de la Chambre de Commerce et d Industrie de Paris) à Noisyle-Grand eb/iste.html htm Les élèves du Mastère en Intelligence Scientifique Technique et Economique ISTE de l ESIEE (CCIP) Un seul outil est souvent insuffisant pour répondre à une problématique. Les familles d outils pour parvenir à un management stratégique de l information sont de plusieurs natures : indexation, workflow, gestion de projet, gestion électronique de documents, EIP (Enterprise Information Portals Portails d entreprises), Intranet, agents de veille, Knowledge Management, etc... Parmi ces outils, nous avons choisi de présenter une large palette des dernières solutions et des perspectives de développement en matière de : statistique, sémantique, traitement du langage naturel, Textmining, Datamining, gestion des connaissances et cartographie. Au cours de cette journée des éditeurs de logiciels comme : ARISEM, LEXIQUEST, ALOGIC, ISCOPE, NAUTITIA et bien d autres feront des démonstrations de leurs produits appliqués à l intelligence économique. Parallèlement, ils présenteront leurs solutions au cours de conférences avec des retours d expérience d utilisateurs. Des tables rondes et des débats ponctueront la journée. Université de Nanterre COMITE SCIENTIFIQUE CHAUDIRON Stéphane, Université de Paris 10 (co-président) COMITE D ORGANISATION IHADJADENE Majid, Université de Paris 10 DALBIN Sylvie, société ATD ROLE François, Université de Paris 10 PALERMITI Rosalba, Université de Grenoble 2 FILTRAGE ET RESUME AUTOMATIQUE DE L INFORMATION SUR LES RESEAUX À l heure de la surinformation sur les réseaux, les technologies de filtrage et de résumé apportent une réponse aux professionnels de l information, cyber-documentalistes, courtiers, veilleurs, webmasters, responsables de portails d information, etc dans des secteurs aussi différents que le knowledge management, le e-commerce et l intelligence économique. La conférence a pour objectif d analyser les enjeux scientifiques, technologiques et industriels du filtrage et du résumé automatique de l information sur les réseaux. Il s agit de rendre compte de l état des recherches et des développements menés en sciences et technologies de l information dans ces domaines, d analyser l impact de ces technologies sur les processus cognitifs d accès à l information et sur les

313 FUTURIBLES INTERNATIONAL Objectifs Objectifs 311 [A1] usages, et d identifier les modifications qu elles peuvent induire sur l organisation des systèmes d information. L approche multidisciplinaire du colloque permettra d éclairer les différents aspects de ces systèmes pour l organisation des connaissances. Le colloque s adresse aussi bien au secteur académique qu au secteur industriel. 10 et 11 octobre , rue de Varenne Paris cedex 07 Hugues de Jouvenel, directeur du groupe Futuribles, et André-Yves Portnoff, directeur de l¹observatoire de la révolution de l¹intelligence à Futuribles International Stratégie et management dans l¹économie de l immatériel. Innovation et compétitivité globales 23 et 24 octobre , rue de Varenne Paris cedex 07 LIPS du CNAM, le Gerpa et Proactivité Conseil Méthodes et outils de la prospective stratégique 8 novembre , rue de Varenne Paris cedex 07 Jacques Lesourne, président de Futuribles International Objectifs Les perspectives géopolitiques et géo-économiques mondiales à l horizon 2010 et et 22 novembre , rue de Varenne Paris cedex 07 Hugues de Jouvenel et Alain Parant, chercheur à l Institut national d études démographiques (INED), conseiller scientifique de Futuribles Objectifs Prospective socio-démographique. Tendances et incertitudes majeures, enjeux sociaux, économiques et politiques à l¹horizon 2010 et 2030 Objectifs AUDIT de L INTELLIGENCE ECONOMIQUE 4 et 5 décembre , rue de Varenne Paris cedex 07 La prospective territoriale et le développement local 29 janvier 2002 IAE de Paris. Salle de conférences. 21, rue Broca Paris 5 ème html Gerpa et Proactivité Conseil Bernard Besson, professeur associé au CISP, Commissaire divisionnaire au Ministère de l Intérieur et membre du Centre d études et de prospective stratégique et Jean- Claude Possin, Commissaire divisionnaire honoraire de la Police nationale, il a été membre du cabinet d audit et contrôle de l IGPN (Inspection Générale de la Police Nationale) du groupe d intelligence économique de l IHESI (Institut des Hautes Etudes de la Sécurité

314 Objectifs FUTURIBLES INTERNATIONAL 312 [A1] Intérieure). Il est actuellement consultant d entreprise. Présentation des enjeux stratégiques d un dispositif d Intelligence Economique appliqué à l entreprise. Présentation des étapes et des moyens à mettre en oeuvre pour conduire un audit d Intelligence Economique. 26 février , rue de Varenne Paris cedex 07 Objectifs Les perspectives géopolitiques et géo-économiques mondiales à l horizon 2010 et et 7 mars Objectifs Objectifs 55, rue de Varenne Paris cedex 07 Jacques Lesourne, président de Futuribles International, ancien professeur au Conservatoire national des arts et métiers (CNAM), ancien directeur du journal Le Monde Hugues de Jouvenel, directeur général du groupe Futuribles, et Alain Parant, chercheur à l Institut national d études démographiques (INED), conseiller scientifique de Futuribles Prospective socio-démographique : Tendances et incertitudes majeures, enjeux sociaux, économiques et politiques en Europe à l¹horizon 2010 et et 28 mars , rue de Varenne Paris cedex 07 Méthodes et outils de la prospective stratégique 9 et 10 avril , rue de Varenne Paris cedex 07 Futuribles International avec le LIPS du CNAM. GERPA et Proactivité Conseil avec François Bourse, directeur à Proactivité Conseil, Pierre Chapuy, directeur d¹études au Gerpa, Michel Godet, directeur du Laboratoire d Investigation Prospective et Stratégique (LIPS), Hugues de Jouvenel, directeur général du groupe Futuribles, Jacques Lesourne, président de Futuribles International, et Vincent Pacini, directeur à Proactivité Conseil Futuribles International en coopération avec le Gerpa et Proactivité Conseil, avec Hugues de Jouvenel, directeur général du groupe Futuribles, Philippe

315 [A1] Objectifs Objectifs Objectifs Colloque sur la Cartographie de l information à l ESIEE Objectifs L Intelligence économique et les entreprises de Midi- Pyrénées. Quelles pratiques? Quels métiers? Objectifs Conférence-débat sur le thème : «Stratégieréseau : Comment mobiliser les acteurs au service d un projet?» L externalisation dans les services de documentation : réalité et enjeux aujourd hui La prospective territoriale et le développement local 24 et 25 avril , rue de Varenne Paris cedex Mirenowicz, directeur du Gerpa, Vincent Pacini, directeur à Proactivité Conseil Hugues de Jouvenel, directeur général du groupe Futuribles, et André-Yves Portnoff, directeur de l Observatoire de la révolution de l intelligence à Futuribles International Stratégie et management dans l économie de l immatériel. Innovation et compétitivité globale 29 et 30 mai , rue de Varenne Paris cedex 07 Hugues de Jouvenel, directeur général du groupe Futurible Séminaire d introduction à la veille et à la démarche prospective. Tendances lourdes, signaux faibles et enjeux du futur en Europe occidentale à l horizon Avril ESIEE Mastère en 2002 intelligence scientifique, technique et économique de l ESIEE Enquête d évaluation des outils de cartographie de l information auprès des utilisateurs 12 mars 2002 Manufacture des Tabacs, Allée de Brienne, DESS Intelligence économique et le Mastère intelligence économique - Ecole Supérieure de Commerce (ESC) et l Institut National Polytechnique (INP) de Toulouse. Avec la participation de professionnels de la région (EADS, Thales-Avionnics, Motorola, 3A, Sogeclair Présentation des formations et des pratiques d intelligence économique dans les entreprises de Midi Pyrénées 27 IAE de Paris Christian Marcon novembre est Docteur en 2002 sciences économiques, enseignantchercheur à la Faculté de Sciences Economiques de Poitiers. 16 janvier 2003 Journée d étude organisée par les délégations régionales ADBS Rhône- Alpes/Grenoble et Rhône-Alpes/Lyon, avec la

316 [A1] Objectifs EGC 2004 Quatrièmes Journées francophones d Extraction et de Gestion des Connaissances Objectifs 5 ème challenge inter- IUT de la veille Objectifs Gestion de l information et des connaissances : vers participation du groupe Ecole supérieure de commerce de Grenoble Alors que de nombreuses études existent dans d autres secteurs, la pratique de l externalisation dans les services documentation est une réalité encore mal connue. Opportunité de se recentrer sur des fonctions à valeur ajoutée pour les uns, menace pour l existence des services documentation pour les autres, cette question peut aussi soulever le débat. Les services documentation soustraitent-ils de plus en plus d activités à des prestataires extérieurs ou continuent-ils en majorité à tout réaliser en interne? Quelles sont les activités que l on peut sous-traiter? A quels types de fournisseurs et pour quelles prestations? Quels sont les avantages et les inconvénients de l externalisation? Quels sont les enjeux et les implications pour les services documentation? Quels sont les impératifs de gestion de la relation avec les sous-traitants?... Autant de questions qui seront abordées lors de cette journée d étude rassemblant les différents acteurs en présence, experts de l externalisation, prestataires, services de documentation donneurs d ordres. La présentation des résultats d une enquête nationale auprès des adhérents complètera les débats pour faire un point concret et précis sur cette question Janvier 2004 Clermont- Ferrand Président d honneur : Gregory Piatetsky- Shapiro (KDNuggets, USA) Présidents du comité de programme : Georges Hébrail (ENST, Paris) Ludovic Lebart (CNRS, ENST, Paris) Président du comité d Organisation : Jean-Marc Petit (LIMOS, Clermont-Fd) Dans le prolongement des trois manifestations précédentes, EGC 2004 ambitionne de regrouper des chercheurs, industriels et utilisateurs francophones issus des communautés Bases de Données, Apprentissage, Représentation des Connaissances, Statistiques et Fouilles de données. Aujourd hui, de grandes masses de données structurées ou semi-structurées sont accessibles dans les bases de données d entreprises ainsi que sur la toile. Aussi les entreprises ont-elles besoin de méthodes et d outils capables d extraire les connaissances pertinentes pour les décideurs, de les stocker, et de les diffuser aux différents acteurs de l organisation. Pour répondre à cette attente, de nombreux projets de recherche se développent autour de l extraction de connaissances à partir de données (Knowledge Discovery in Data), ainsi que sur la gestion de connaissances (Knowledge Management). L objectif de ces journées consiste à rassembler, d une part les chercheurs des disciplines connexes (apprentissage, statistiques et analyse de données, systèmes d information et bases de données, ingénierie des connaissances, etc.), et d autre part les spécialistes d entreprises qui déploient des méthodes d EGC, afin de contribuer à la formation d une communauté scientifique dans le monde francophone autour de cette double thématique de l extraction et de la gestion de connaissances. 19 janvier au 5 février 2004 L IUT de Besançon- Vesoul L IUT de Besançon-Vesoul Département Information- Communication et Licence «Veille» Le challenge inter-iut de la veille met en compétition des équipes d étudiants issues d établissements d enseignement supérieur offrant des formations spécifiques en information d entreprise. Le sujet est proposé par une entreprise de dimension internationale. Sur un thème technologique relativement complexe, les étudiants doivent montrer leur capacité à se saisir en un temps limité de toute l information disponible, à la synthétiser et à la mettre en perspective, afin de fournir au commanditaire la base d une réflexion stratégique. Cette année, le sujet proposé par le Centre de recherche Nestlé est: «How to find relevant scientific and technological information through the Web to support innovation in the food industry?» 2 avril ESIEE Noisyle-Grand Organisé par 2004 l APIL (Association des

317 [A1] une approche globale Objectifs V.S.S.T VEILLE STRATEGIQUE SCIENTIFIQUE & TECHNOLOGIQUE SYSTÈMES D INFORMATION ELABORÉE, BIBLIOMÉTRIE, LINGUISTIQUE, INTELLIGENCE ÉCONOMIQUE Objectifs Net 2004 : Compétitivité et lnnovation Professionnels des Industries de la Langue) et le Mastère Spécialisé en Intelligence Scientifique Technique et Economique du Groupe ESIEE (Ecole Supérieure d Ingénieurs en Electronique et Electrotechnique) Quels services réels peut-on attendre aujourd hui des outils linguistiques? Comment les mettre en oeuvre dans l organisation et les rentabiliser? Comment les intégrer dans l organisation? Synergie et ré-usage des méthodes et des outils. Apports de la linguistique ROI et impacts organisationnels. La gestion des contenus est devenue omniprésente dans l entreprise et recouvre des aspects aussi variés que la veille, l intelligence économique, la recherche d informations, la gestion du capital intellectuel ou l accès aux brevets... Optimiser cette gestion des contenus passe par la mise en œuvre d outils méthodologiques et logiciels spécifiques. La question de l interopérabilité des outils ainsi que celle des synergies entre les méthodes se pose alors, afin d optimiser les retours sur investissement et d augmenter le service rendu par ces outils et méthodes. Cette journée tentera de faire le point sur ces synergies en présentant les acteurs spécialisés dans la gestion des contenus - fournisseurs de solutions logiciel ou de services - et en présentant des cas concrets. L interopérabilité des systèmes et méthodes sera également considérée octobre 2004 TOULOUSE Ces quatrièmes journées VSST sont organisées, conjointement par : L Université Polytechnique de Catalogne (UPC), l Institut de Recherche en Informatique de Toulouse (IRIT) et la Société Française de Bibliométrie Appliquée(SFBA). Le colloque VSST 2004 est organisé pour présenter des travaux de recherche et de développement industriel particulièrement ; innovants dans le domaine des systèmes de Veille Stratégique Scientifique et Technologique. Les données scientifiques et techniques, qu elles soient textuelles ou factuelles, formelles ou informelles, constituent des mines d informations stratégiques aussi bien pour les décideurs (intelligence économique, veille concurrentielle) que pour les chercheurs et les ingénieurs (veille scientifique et technologique). Cependant, devant la masse croissante d information, les organismes ont besoin de systèmes d aide à l analyse de plus en plus performants. Ces systèmes doivent offrir des possibilités d exploration très fines et de représentation synthétique de l information recueillie et des nouvelles connaissances déduites. En amont, ils doivent assurer la collecte, la sélection et le filtrage de l information électronique disponible dans des bases spécialisées internes, externes et sur Internet, ainsi que la prise en compte des données informelles collectées, sur le terrain, par les différents acteurs de la veille. En aval, pour la restitution des résultats, ils doivent privilégier l ergonomie dans les fonctions de présentation, de visualisation, de navigation et de synthèse. Dans cette quatrième édition du colloque VSST, un intérêt tout particulier sera accordé aux méthodes et applications qui garantissent une exploitation efficace des grandes masses de documents et qui sont porteuses d une réelle plus-value informationnelle : collecte et extraction d informations pertinentes, exploration, analyse et synthèse, interactivité dans les systèmes de découverte, gestion des connaissances 6 et 7 avril 2004 Ministère à la Recherche et aux Nouvelles Technologies 1, rue Descartes - Paris _complet_net2004.pdf 315 L AFNET, Association Française des Utilisateurs du NET, réunit des acteurs de tous les horizons (Grandes Entreprises, PME, Fournisseurs NTIC, Ministères,

318 [A1] Objectifs Usages et enjeux des weblogs dans la publication et diffusion de l information Objectifs ISKO-FRANCE 2005 Universités, Grandes Ecoles..), autour du triptyque fondateur de l etransformation des entreprises : business, sociétal et technologique. A l origine AFUU, impliquée depuis 20 ans dans la mise en place des nouvelles technologies de l Internet, l AFNET organise depuis 4 ans le principal Congrès et Concours de la Net Economie (Intranet 99, Net 2000, Net 2001, Net 2002, Net 2003), réunissant chaque année plusieurs centaines d orateurs et plusieurs milliers de congressistes, à Paris et en province. La France prend du retard et il n y a plus de moyens nationaux à la hauteur des enjeux. Cette situation compromet la compétitivité, l innovation et l avenir même des entreprises donc l emploi. Il est possible d engager un véritable projet national, ambitieux fonctionnel et partagé pour gagner ensemble être «devant» et non seulement «rattraper notre retard». Pour répondre aux enjeux vitaux pour la compétitivité et l innovation des PME-PMI, des grands industriels et des territoires, l AFNET organise une journée exceptionnelle réunissant les acteurs de cette profonde mutation (Responsables de différents secteurs industriel, de l administration, des Collectivités Territoriales, de fédérations professionnelles...) Au programme des conférences, des tables rondes et des ateliers métiers L intégration numérique facteur-clef de compétitivité Besoins et démarches des secteurs d activité en France et en Europe Accompagner les PME : un impératif stratégique! Quels leviers pour une France qui gagne? Attractivité et développement des territoires dans la société de l information e-collaboration, R&D, PLM et e-design, Relation fournisseurs, Achats, CRM 18 novembre 2004 Salle du Conseil de l IUT A, 115, route de Narbonne à Toulouse. 316 ADBS Midi- Pyrénées De nombreux weblogs ont vu le jour sur internet. Ils correspondent à une sorte de journaux personnels publiés sur le web, comportant des commentaires et des listes de liens, et régulièrement mis à jour. Ils sont étroitement liés au processus de syndication de contenu (ou agrégation de contenu) qui donne la possibilité de publier automatiquement sur un site web, un intranet des informations issues d un autre site web : dernières nouvelles, titres d articles, nouveautés... Nous nous interrogerons plus particulièrement sur ce que ces outils peuvent apporter dans le champ de la gestion de contenu et de la diffusion de l information. 28 et 29 avril 2005 INIST/CNRS, Vandoeuvre-lès- Nancy La conférence ISKO-France 2005 est organisée à l initiative de l équipe SITE du Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA) et du

319 [A1] Objectifs Journée d étude Information scientifique, technique et économique (ISTE) : la formation des utilisateurs et AG ère journée francophone sur les Entrepôts de Données et l Analyse en ligne (EDA 05) Objectifs IE et réseaux : 2 ème journée franco-suisse d intelligence économique Objectifs chapitre français de l association ISKO (International Society for Knowledge Organization) en partenariat avec la Chambre Régionale de Commerce et d Industrie de Lorraine (CRCIL), l Université Nancy 2 et l Institut de l Information Scientifique et Technique du Centre National de la Recherche Scientifique (INIST/CNRS). L une des évolutions les plus marquantes en matière de recherche sur les systèmes d information concerne l orientation utilisateur de ces derniers. Il ne s agit plus de modéliser les informations en fonction de leur contenu mais de leur utilisation dans des contextes élargis (veille concurrentielle, juridique, environnementale, intelligence économique). 28 janvier 2005 Université de Technologie de Troyes ADBS Champagne- Ardenne juin 2005 Lyon ERIC, Université Lumière Lyon 2 L intérêt pour les travaux liés aux entrepôts de données, à l analyse en ligne (OLAP) et aux bases de données multi-dimensionnelles n a cessé de croître aussi bien dans les domaines de la recherche et de l industrie que pour les utilisateurs de manière générale. L objectif de la 1 ère journée francophone sur les Entrepôts de Données et l Analyse en ligne (EDA 05) est de créer et de pérenniser un cadre exclusivement réservé à ces travaux, afin de favoriser la rencontre des chercheurs, des industriels et des utilisateurs français et francophones afin de discuter de l avancement de la recherche ainsi que d expériences de développement dans le domaine des entrepôts de données. Cette journée a pour vocation de devenir un rendez-vous national régulier sur le thème des entrepôts de données. 16 juin Neuchâtel Haute école de 2005 gestion Arc de Neuchâtel, la Haute école de gestion de Genève et l IUT de Besançon (Franche-Comté) organisent une 2 ème journée francosuisse en Intelligence économique et Veille stratégique. Le thème de cette journée est Intelligence économique et réseaux: comment collaborer en réseau dans l entreprise et hors de l entreprise? Les participant-e-s auront l occasion de faire le point sur les réseaux institutionnels avec M. Philippe Clerc, directeur de l Intelligence économique à l Assemblée de Chambres françaises du Commerce et de l Industrie. M. Christian Marcon, Maître de conférences à l Université de Poitiers présentera quant à lui l aspect des réseaux relationnels. Ensuite seront présentés des témoignages et cas de plusieurs entreprises et d Organisations par M. Thierry Baud, du Département fédéral des affaires étrangères, M. Pierre Gfeller, de l Observatoire romand des métiers, M. Michel Guinand, Directeur de la Fondation suisse pour les téléthèses, M. Stéphane Koch, de l Internet Society Geneva, M. Fabien Noir, de Chicago Miniature Lighting IT et

320 [A1] 1ères Rencontres Innovation, Compétitivité et Connaissances Objectifs M. Marc Vuillet à Ciles, de l Agence d intelligence économique de Franche-Comté. 28, 29 et 30 Paris septembre L ambition des 1ères Rencontres Innovation, Compétitivité et Connaissances est d installer dans la durée une manifestation nouvelle et unique en France qui vise à se placer concrètement au cœur des enjeux technologiques, économiques et organisationnels de la création de valeur et de la maîtrise stratégique dans la société de la connaissance. Réunissant les Rencontres KM&EC 2005 dédié au Knowledge Management et l Efficacité Collective, et le Forum IE 2005 dédié à l Intelligence Economique et la Veille, ces Rencontres sont portées, construites et animées par des professionnels du métier, pionniers et praticiens de la société de la connaissance, Jacqueline Sala (Veille Magazine) et Richard Collin (ICCE et animateur depuis 8 ans du KM Forum qu il a fondé et animé et qui se transforme). L objectif : partager pratiques, expériences et visions avec les personnalités et décideurs; réseauter et échanger avec experts et praticiens ; faire le point et des affaires avec l ensemble des acteurs du marché, partenaires offreurs de solutions et utilisateurs visiteurs et participants. Figure A1 1 : Récapitulatif des données extraites des listes de diffusion et groupes de discussion de 2000 à 2005 avant analyse. 318

321 [A2] [A2] Annexes : Guide pour COGNOS Guide d installation et de configuration de Cognos Edition 7.3. Ce guide est réalisé à partir d informations que l on peut trouver sur un site canadien nommé Virtuose, émanant d HEC Montréal - L École des hautes études commerciales de Montréal. Virtuose est une plate forme d aide à l installation et de prise en main de logiciels. 1. Installation 1) Double-cliquez sur le fichier Setup.exe 2) Cliquez sur Installer PowerPlay Transformer Edition pour Windows Figure A2 1 : Ecran 1 319

322 [A2] 3) Cliquer sur Suivant Figure A2 2: Ecran 2 4) Cliquer sur J accepte puis sur Suivant. Figure A2 3: Ecran 3 320

323 [A2] 5) Entrez votre nom dans les champs Nom et cliquez sur Suivant Figure A2 4: Ecran 4 6) Cliquez sur personnalisée puis sur Suivant Figure A2 5 : Ecran 5 321

324 [A2] 7) Cliquer sur Présentation rapides de PowerPlay Transformer Edition de façon à mettre un crochet vert à coté puis cliquez sur Suivant. Figure A2 6 : Ecran 6 8) Choisir l emplacement et cliquez sur Suivant. Figure A2 7 : Ecran 7 322

325 [A2] 9) Cliquez sur Oui Figure A2 8 : Ecran 8 10) Cliquez sur Suivant Figure A2 9 : Ecran 9 323

326 [A2] 11) Cliquez sur Suivant Figure A2 10 : Ecran Configuration 1) Cliquez sur Ouvrir Configuration Manager pour personnaliser la configuration des composants puis cliquez sur Suivant. Figure A2 11 : Ecran

327 [A2] 2) Cliquez sur Fermer Figure A2 12 : Ecran 12 3) Aller dans fichier Ouvrir la configuration actuelle Figure A2 13 : Ecran

328 [A2] 4) Cliquez sur Serveur d annuaire (à droite) et choisir Aucun. Figure A2 14 : Ecran

329 [A2] 5) Cliquez sur Valider la sélection dans le menu Opérations Figure A2 15 : Ecran 15 6) Cliquez sur Oui Figure A2 16 : Ecran

330 [A2] 7) Cliquez sur Ok Figure A2 17 : Ecran 17 8) Cliquez sur Quitter dans le menu Fichier. Figure A2 18 : Ecran

331 [A2] 9) Cliquez sur Non Figure A2 19 : Ecran 19 10) Cliquez sur Non Figure A2 20 : Ecran 20 11) Retourner à la fenêtre principale et cliquez sur Terminer Figure A2 21 : Ecran

332 330

333 [A3] [A3] Annexes : Produits commerciaux Cette annexe permet de développer quelques outils et de proposer des tableaux à partir de produits commerciaux : Intelligent Miner d IBM Famille d outils qui permet la préparation des sources de données relationnelles et qui comporte la sélection des données à explorer, le codage, la détermination des valeurs manquantes et l agrégation de valeurs. Diverses techniques sont ensuite proposées pour extraire les connaissances. Puis, des outils de présentation permettent de visualiser les résultats. Ils comportent trois composantes : un moteur de recherche textuel avancé, un outil d accès au Web, et un outil d analyse de textes. SPSS un des leaders du marché du data mining Il offre une large gamme de produits incluant l outil de base SPSS historiquement réputé pour ses statistiques. SPSS a racheté la société anglaise Integral Solution (ISL) et son système Clementine. Ses solutions permettent l accès et la gestion de données, la visualisation des données, la présentation de rapports multidimensionnels, les statistiques traditionnelles, la construction d arbres de décision, l utilisation de réseaux de neurones, la distribution de rapports électroniques statistiques ou graphiques. SAS SAS propose un outil très complet pour le data mining. Entreprise Miner, à partir de données d entrées, il permet d élaborer un graphe de flux de processus dans lequel chaque nœud représente l application d une technique particulière de data Mining. Darwin de Thinking Machines Intègre trois techniques de base : réseaux de neurones, arbres de décision basés sur une segmentation par régression et raisonnement basé mémoire. L outil fonctionne en clientserveur et propose des modules de transformation de données et de visualisation de résultats. Parmi les outils existants, la quasi-majorité d entre eux ne s intéresse qu à la partie en aval de la construction d un entrepôt de données : la partie fouille de données. Très peu d outils existent sur la phase d élaboration de l entrepôt de données, et plus particulièrement sur la création des référentiels de métas données. On trouve néanmoins quelques outils d extraction (dictionnaire des métas données). 331

334 [A3] Editeur Progiciel Site web IBM DB2 Microsoft SQL Server NCR Corporation Teradata Oracle Corporation Oracle PostgreSQL PostgreSQL Tableau A3 1 : SGBD relationnels Editeur Progiciel Site web Transformation Data Mirror Server ETI ETI Extract Informatica Information Builders Oracle Corporation PowerCenter ETL Manager ETL Manager Warehouse builder ml Pervasive Pervasive Sagent Group 1 Software Data Flow Sunopsis Sunopsis ISoft Amadea IBM Hummingbi rd Websphere Datastage Hummingbird ETL Business Objects Data Integrator Tableau A3 2 : Outil d ETL tm Editeur Progiciel Site web Computer Associates Advantage Data Transformer Tableau A3 3 : Transformation des données 332

335 [A3] Editeur Progiciel Site web SAS SAS Business Objects HarrySoftw are SAP Business Objects ou B.O. HarryPilot, HarryCube, Business Information Warehouse SYNAXE LATITUDES Tableau A3 4 : Requêteur Olap Editeur Progiciel Site web Digicap EasyOlap Explorateur Tableau A3 5 : Explorateur de cubes OLAP Editeur Progiciel Site web MicroStrate gy MicroStrategy 7i Tableau A3 6 : Moteur R-Olap Editeur Progiciel Site web Hyperion Essbase Tableau A3 7 : Moteur M-OLAP Editeur Progiciel Site web Cognos 4Thougth Cognos PowerPlay Products ISoft Alice IBM Intelligent Miner SAS Enterprise Miner SPSS Clementine Tableau A3 8 : Outils de datamining Editeur Progiciel Site web ASG Allen Systems Group Synergy SAS IBM Rochade Meta Analysis Websphere Metastage Tableau A3 9: Gestion des métas données Metadata

336 334

337 [A4] [A4] Annexes : Produits alternatifs Voici une proposition de quelques produits alternatifs : Jasper Reports Open Reports Sunshine Reports DataVision Agata Progiciel JFree Reports / JFree Charts Rlib BIRT, Business Intelligence & Reporting Tool Site web Tableau A4 1 : Les outils de reporting Mondrian Progiciel Fonctions Site web Serveur OLAP en Java. Permet d exploiter de très grandes bases SQL sans avoir à écrire de requêtes SQL JPivot : utilise Mondrian comme moteurs OLAP et permet des explorations OLAP évoluées (slice, drill, ) Supporte XMLA comme vecteur d accès aux données R project Palo pour Microsoft Excel Tableau A4 2: Les serveurs d analyse Outil d analyse, de calcul statistique et de génération de graphes. Utilisé par le Bee project Open Source database MOLAP : cellbased, hiérarchique, orientée mémoire Progiciel Fonctions Site web Enhydra Octopus Java + XML Clover.ETL Java + XML KETL Talend Java + XML Avec Greenplum / Bizgres L ETL «turbo» [NIEUWBOURG, 2005] Tableau A4 3 : ETL (Extraction, Transformation and Loading) 335

338 [A4] Progiciel Fonctions Site web Proteus Java Open EAI Open Adaptor Java + XML Business Integration Engine Tableau A4 4: EAI (Enterprise Application Integration) Progiciel Fonctions Site web WEKA Intègre un moteur de visualisation. De nombreux projets dérivés : Parallélisme, Data mining distribué, Systèmes apprenants GDataMine YALE ml Tanagra Orange Illimine Tableau A4 5 : data mining engines Progiciel Fonctions Site web Greenplum Bizgres = postgresql for BI & data warehousing Clickstream = BI stack Bizgres + JasperReports + Kinetic Networks ETL (KETL) Utilisé dans SpagoBI Bee project Bee web analyzer Pentaho Package industriel de génération de rapports, d analyse, de génération de tableaux de bord, d extraction de données, et de gestion des processus d entreprise. Ce produit propose des configurations de déploiement adaptable ce qui favorise la réutilisation, la personnalisation des applications et la mise à disposition des clés en main d une plateforme intégrée de BI. Mondrian, JPivot, Enhydra Shark (workflow server) Spago BI, portail analytique Au sein du consortium ObjectWeb Sur le serveur d applications J2EE exoplatform et autres serveurs J2EE Rapports avec JasperReport OLAP avec Mondrian et l interface JPivot Tableau de bord avec OpenLaszlo (Eclipse) Contrôle de rendu des rapports avec Groovy (Eclipse, JEdit) Datamining avec Weka Tableau A4 6 : Les outils décisionnels intégrés 336

339 [A5] [A5] Annexes : Récupération de données XML Figure A5 1 : Étape 1 Choix du type d ouverture Cette première étape est utile si l on ne possède pas ou ne connaît pas le schéma XML sous jacent propre au fichier. Dans notre cas, ne possédant pas ce schéma, nous avons utilisé la fonction de détection automatique. Figure A5 2 : Étape 2 Création automatique d un schéma XML Après avoir généré ce schéma, on obtient la hiérarchie des balises XML, nécessaire à garder la cohérence des données lors de leur importation. Figure A5 3 : Schéma XML créé A partir de ce schéma, le logiciel importe les données et l on obtient un fichier contenant toutes les informations contenues dans le fichier source. 337

340 338

341 [A6] Annexes : Récupération de données Excel dans Access [A6] Expliquons comment obtenir une base en quelques étapes. Tout d abord, après avoir créé une nouvelle base, on choisit dans l onglet «Fichier», l option «Importer» dans le menu «Données Externes» comme indiqué ci-dessous. Figure A6 1 : Importer un document On choisit ensuite le fichier Excel que l on souhaite transformer en base. Figure A6 2 : Choix du document Une fois le fichier source choisi, un assistant de création de base apparaît. Nous allons voir maintenant les 6 étapes successives de cet assistant, permettant de finaliser la structuration et la présentation des données. On commence donc par choisir la feuille de calcul Excel contenant les informations à transférer. 339

342 [A6] Figure A6 3 : Étape 1 Choix de la feuille de calcul Ensuite vient le choix des identifiants de la table. Pour cela l utilisateur peut choisir de considérer la première ligne de la feuille comme contenant l entête des colonnes. Figure A6 4 : Étape 2 Choix des identifiants de colonnes L étape suivante consiste à déterminer si l on désire créer une nouvelle table, ou si l on préfère utiliser une table déjà existante pour contenir les données. Dans notre cas, pour chaque fichier source, nous avons créé une base contenant une table Figure A6 5 : Étape 3 Importation dans une nouvelle table 340

343 [A6] Il est de plus possible de personnaliser l importation. En effet, l utilisateur peut renommer les champs, en choisir comme index ou non, modifier le type de données des champs, mais aussi décider de ne pas en importer certains. Figure A6 6 : Étape 4 Modification des identifiants de colonnes L étape 5 consiste à définir la clé primaire de la table. Il est donc possible de laisser Access s occuper de l ajout de cette clé (ajout d un numéro), ou de choisir nous même la clé (colonne) identifiant les différents enregistrements. Figure A6 7 : Étape 5 Choix de la clé primaire Enfin, la dernière étape permet de donner un nom à la table que l on va générer. Il est aussi possible de choisir deux options, avant de fermer l assistant, tel que la vérification de la structure de la table, ou encore l ouverture de la rubrique d aide. 341

344 342

345 [A7] Annexes : Installation de Mondrian/Openi sous Windows [A7] Logiciels utilisés : Java : jdk-1_5_0_06-windows-i586-p.exe Tomcat : apache-tomcat exe Easyphp : easyphp1-8_setup.exe Openi : openi release.zip Rappel : Tous les softs utilisés pour l'utilisation d'openi sont dans: Installation de Java Figure A7 1 : Java écran 1 Figure A7 2 : Java écran 2 343

346 [A7] Figure A7 3 : Java écran 3 Figure A7 4 : Java écran 4 Installation de Tomcat Figure A7 5 : Tomcat écran 1 344

347 [A7] Figure A7 6 : Tomcat écran 2 Figure A7 7 : Tomcat écran 3 Figure A7 8 : Tomcat écran 4 345

348 [A7] Figure A7 9 : Tomcat écran 5 Figure A7 10 : Tomcat écran 6 Figure A7 11 : Tomcat écran 7 346

349 [A7] Installation d Easyphp Figure A7 12 : Easyphp écran 1 Figure A7 13 : Easyphp écran 2 Figure A7 14 : Easyphp écran 3 347

350 [A7] Figure A7 15 : Easyphp écran 4 Figure A7 16 : Easyphp écran 5 Figure A7 17 : Easyphp écran 6 348

351 [A7] Figure A7 18 : Easyphp écran 7 Figure A7 19 : Easyphp écran 8 Figure A7 20 : Easyphp écran 9 349

352 [A7] Installation d Openi Figure A7 21 : Openi extraction du fichier compressé Figure A7 22 : Extraction placée dans un répertoire du nom openi Commande : Redémarrer Windows : Tomcat est démarré 350

353 [A7] Figure A7 23 : Sélection des fichiers à copier Figure A7 24 : Coller les fichiers sélectionnés dans le répertoire webapps de Tomcat 351

354 [A7] Figure A7 25 : Création des répertoires mondrian, openi, openi-projects Commande : Lancer Easyphp Figure A7 26 : Identification du dossier et des fichiers de travail foodmart, foodmart.xml, xmla.jsp, index.jsp Commande : Copier le dossier foodmart dans Easyphp1-8>mysql>data 352

355 [A7] Figure A7 27 : Dossier foodmart dans Easyphp Commande : Copier foodmart.xml et xmla.jsp dans Tomcat 5.5>mondrian>WEB- INF>queries Figure A7 28 : Dossier foodmart.xml et xmla.jsp dans Tomcat 5.5 >mondrian>web- INF>queries 353

356 [A7] Commande : Copier index.jsp dans Tomcat 5.5>webapps>mondrian Figure A7 29 : Dossier index.jsp dans Tomcat 5.5>webapps>mondrian Figure A7 30 : Lancement de Tomcat Manager 354

357 [A7] Figure A7 31 : Authentification en «admin» mode administateur Figure A7 32 : Lancement de Mondrian et/ou d Openi 355

358 [A7] Figure A7 33 : Analyse sous Mondrian des logins des utilisateurs sur l ENT des acteurs Figure A7 34 : Exemple de requête MDX Figure A7 35 : Sélection au niveau des mois 356

359 [A7] Figure A7 36 : Choix des représentations graphiques ouvrir la navigation OLAP 2.ouvrir un éditeur MDX 3.configurer la table OLAP 4.montrer les membres parents. 5.cacher les spans 6.monter les propriétés 7.supprimer les lignes et les colonnes vides 8.inverser les axes 9.explorer les membres 10.explorer les positions 11.drill replace 12.drill throw 13.montrer les tableaux Figure A7 37 : Visualisation graphique pour les étudiants et explication des icônes 357

360 358

361 [A8] Annexes : Profils utilisateurs dans Openi sous Windows [A8] 1. Création d'un compte (profil) sur le serveur web «Apache» Prérequis: apache-tomcat exe. Pour plus de facilité nous installons le module d'administration : apache-tomcat admin Rappel : Tous les softs utilisés pour l'utilisation d'openi sont dans : copier "admin.xml" dans C:\Program Files\Apache Software Foundation\Tomcat 5.5\conf\Catalina\localhost copier le répertoire: apache-tomcat /server/webapps/admin dans C:\Program Files\Apache Software Foundation\Tomcat 5.5\server\webapps Création des comptes : Le module d'administration graphique permet de créer des noms d'utilisateurs : User Name admin administratif both enseignant etudiant responsable role1 tomcat Création des rôles : Full Name Après la création des comptes, il faut attribuer des rôles par utilisateur: Role Name admin administratif enseignant etudiant manager responsable role1 tomcat toto Description 359

362 [A8] Voici un exemple pour le compte «enseignant» : User Properties User Name: Password: enseignant Full Name: Group Name Description Role Name Description admin administratif enseignant rien etudiant manager responsable role1 tomcat toto 2. Création des profils dans OPENI Se rendre sur C:\Program Files\Apache Software Foundation\Tomcat 5.5\webapps\openiprojects pour dupliquer le répertoire foodmart et renommer ce dernier avec le nom d'un compte utilisateur. Prenons l'exemple du compte dupliqué «enseignant» Dans "C:\Program Files\Apache Software Foundation\Tomcat 5.5\webapps\openi-projects\enseignant" se trouve le fichier «project.xml» qu il faut éditer avec le bloc note pour ajouter cette ligne: <projectusers>enseignant </projectusers>. Pour plus de précision voici un exemple du fichier project.xml pour le compte enseignant Toute la phase de création des comptes par l interface graphique remplit le fichier tomcatusers.xml situé dans : C:\Program Files\Apache Software Foundation\Tomcat 5.5\conf\tomcat-users.xml 360

363 [A9] Annexes : Schéma développé de l application sous Openi <?xml version="1.0"?> - <Schema name="foodmart"> - <Cube name="modele_jours"> <Table name="table_fait_jours" /> - <Dimension name="acteur" foreignkey="jour_id"> - <Hierarchy hasall="true" primarykey="jours_id"> <Table name="statjours" /> <Level name="acteur" column="personne" uniquemembers="true" /> </Hierarchy> </Dimension> - <Dimension name="service" foreignkey="jours_id"> - <Hierarchy hasall="true" primarykey="jours_id"> <Table name="statjours" /> <Level name="service" column="service" uniquemembers="true" /> </Hierarchy> </Dimension> - <Dimension name="jour" foreignkey="jour_id"> - <Hierarchy hasall="true" primarykey="jours_id"> <Table name="statjours" /> <Level name="jour" column="jour" type="numeric" uniquemembers="true" /> </Hierarchy> </Dimension> <Measure name="servcalls" column="servcalls" aggregator="sum" formatstring="#" /> <Measure name="nbusersserv" column="nbusersserv" aggregator="sum" formatstring="#" /> <Measure name="nbusers" column="nbusers" aggregator="sum" formatstring="#" /> <Measure name="allsserv" column="allsserv" aggregator="sum" formatstring="#" /> <Measure name="nbusersperso" column="nbusersperso" aggregator="sum" formatstring="#" /> <Measure name="nbservicescallsperso" column="nbservicescallsperso" aggregator="sum" formatstring="#" /> </Cube> - <Cube name="modele_mois"> <Table name="table_fait_mois" /> - <Dimension name="acteur" foreignkey="mois_id"> - <Hierarchy hasall="true" primarykey="mois_id"> <Table name="statmois" /> <Level name="acteur" column="personne" uniquemembers="false" /> </Hierarchy> </Dimension> - <Dimension name="service" foreignkey="mois_id"> - <Hierarchy hasall="true" primarykey="mois_id"> <Table name="statmois" /> <Level name="service" column="service" uniquemembers="false" /> </Hierarchy> </Dimension> - <Dimension name="mois" foreignkey="mois_id"> - <Hierarchy hasall="true" primarykey="mois_id"> <Table name="statmois" /> <Level name="mois" column="mois" type="numeric" uniquemembers="false" /> </Hierarchy> </Dimension> 361 [A9]

364 <Measure name="servcalls" column="servcalls" aggregator="sum" formatstring="#" /> <Measure name="nbusersserv" column="nbusersserv" aggregator="sum" formatstring="#" /> <Measure name="nbusers" column="nbusers" aggregator="sum" formatstring="#" /> <Measure name="allsserv" column="allsserv" aggregator="sum" formatstring="#" /> <Measure name="nbusersperso" column="nbusersperso" aggregator="sum" formatstring="#" /> <Measure name="nbservicescallsperso" column="nbservicescallsperso" aggregator="sum" formatstring="#" /> </Cube> - <Cube name="synthese"> <Table name="table_fait_synt" /> - <Dimension name="evenement" foreignkey="id_fait_synt"> - <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese" /> <Level name="level2" column="evenements" uniquemembers="true" /> </Hierarchy> </Dimension> - <Dimension name="theme" foreignkey="id_fait_synt"> - <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese" /> <Level name="level1" column="themes" uniquemembers="true" /> </Hierarchy> </Dimension> - <Dimension name="secteur" foreignkey="id_fait_synt"> - <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese" /> <Level name="level3" column="secteur" uniquemembers="true" /> </Hierarchy> </Dimension> - <Dimension name="objectif" foreignkey="id_fait_synt"> - <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese" /> <Level name="level4" column="objectifs" uniquemembers="true" /> </Hierarchy> </Dimension> - <Dimension name="date" foreignkey="id_fait_synt"> - <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese" /> <Level name="level5" column="date" uniquemembers="true" /> </Hierarchy> </Dimension> - <Dimension name="organisateur_type" foreignkey="id_fait_synt"> - <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese" /> <Level name="level6" column="organisateur_type" uniquemembers="true" /> </Hierarchy> </Dimension> - <Dimension name="organisateur_specialite" foreignkey="id_fait_synt"> - <Hierarchy hasall="true" primarykey="id_fait_synt"> <Table name="synthese" /> <Level name="level7" column="organisateur_specialite" uniquemembers="true" /> </Hierarchy> </Dimension> 362 [A9]

365 <Measure name="mesure 1" column="id_themes" aggregator="sum" formatstring="#" /> <Measure name="mesure 2" column="id_evenements" aggregator="sum" formatstring="#" /> <Measure name="mesure 3" column="id_secteur" aggregator="sum" formatstring="#" /> <Measure name="mesure 4" column="id_objectifs" aggregator="sum" formatstring="#" /> <Measure name="mesure 5" column="id_date" aggregator="sum" formatstring="#" /> <Measure name="mesure 6" column="id_organisateur_type" aggregator="sum" formatstring="#" /> <Measure name="mesure 7" column="id_organisateur_specialite" aggregator="sum" formatstring="#" /> </Cube> - <Cube name="rubi3"> <Table name="ma_table_fait" /> - <Dimension name="enseignant" foreignkey="id_cle"> - <Hierarchy hasall="true" primarykey="id_cle"> <Table name="ma_table" /> <Level name="toto" column="enseignants" uniquemembers="true" /> </Hierarchy> </Dimension> - <Dimension name="act_enseig" foreignkey="id_cle"> - <Hierarchy hasall="true" primarykey="id_cle"> <Table name="ma_table" /> <Level name="act_enseig" column="act_enseig" uniquemembers="true" /> </Hierarchy> </Dimension> - <Dimension name="fonct_enseig" foreignkey="id_cle"> - <Hierarchy hasall="true" primarykey="id_cle"> <Table name="ma_table" /> <Level name="fonct_enseig" column="fonct_enseig" uniquemembers="true" /> </Hierarchy> </Dimension> <Measure name="sans_infos_enseignants" column="sans_infos_enseignants" aggregator="sum" formatstring="#" /> <Measure name="professeur_enseignants" column="professeur_enseignants" aggregator="sum" formatstring="#" /> <Measure name="eneig_cherc_enseignants" column="eneig_cherc_enseignants" aggregator="sum" formatstring="#" /> </Cube> -  - <Role name="california manager"> - <SchemaGrant access="none"> - <CubeGrant cube="modele_jours" access="all"> <HierarchyGrant hierarchy="[jour]" access="none" /> </CubeGrant> </SchemaGrant> </Role> </Schema> [A9] 363

366 364

367 Glossaire 365

368 366

369 Glossaire Glossaire Active directory : Active directory est un annuaire au sens informatique chargé de répertorier tout ce qui touche au réseau comme le nom des utilisateurs, des imprimantes, des serveurs, des dossiers partagés, etc. L utilisateur peut ainsi trouver facilement des ressources partagées, et les administrateurs peuvent contrôler leurs utilisations grâce à des fonctionnalités de distribution, de duplication, de partitionnement et de sécurisation des accès aux ressources répertoriés. Adaptateur (Adapter ou Wrapper en anglais) : Composant capable de traduire les requêtes et les données depuis le modèle d une source locale vers le modèle de l entrepôt et vice versa. Agrégation : Action de calculer les valeurs associées aux positions parents des dimensions hiérarchiques. Cette agrégation peut être une somme, une moyenne, ou tout autre processus plus complexe comme la deuxième plus forte valeur. APOGEE : Logiciel de gestion de la scolarité. Il apporte des réponses précises en matière de clarification de l offre de formation, d amélioration de l accueil des étudiants, de gestion de la scolarité et de pilotage de l établissement. ARIADNE : Alliance of Remote Instructional Authoring and Distribution Networks for Europe. Back office : Désigne le dispositif d administration technique d un site et l ensemble des outils utilisé par le service ou la personne qui en a la responsabilité. Business Process Management System : Système de contrôle de processus. Couperin: Consortium Universitaire de Périodiques Numériques. CPL : Common Public licence. Licence de logiciel libre d IBM non compatible avec la GPL (General Public Licence) parce qu elle énonce diverses exigences spécifiques qui ne se trouvent pas dans la GPL. Notamment, elle exige que certaines licences de brevet soient données, ce que la GPL n exige pas. Par exemple, elle autorise la modification du code source et garantit le respect des brevets logiciels. Data mining : Fouille de données. Data provider : Fournisseur de données. 367

370 Glossaire Dokeos : Dokeos est un logiciel libre utilisé pour gérer l'apprentissage et la collaboration. Il permet à l'enseignant/formateur de créer du contenu, de structurer les activités d'apprentissage sous forme de parcours, d'interagir avec les étudiants/stagiaires et de suivre leur évolution. Drill Down : Forer vers le bas. Aller du général au particulier dans une recherche d information dans une base de données multidimensionnelle. Détailler selon une dimension, par exemple année, Mois et Semaine. Drill up : Analyse de données à un attribut parent. Remonter dans la hiérarchie dune dimension. Front office : Le front office est la partie d'un site web visible par les visiteurs ou accessible par des clients. HARPEGE : Logiciel de gestion des ressources humaines en université. Horizon : Logiciel de gestion documentaire. Indicateur : Un indicateur permet de mesurer une situation ou un risque, de donner une alerte ou au contraire de signifier l avancement correct d un projet. Le choix des indicateurs dépend des objectifs du projet. JOLAP : Java On-Line Analytical Processing. Equivalent pour les bases décisionnelles comme les datawarehouse (entrepôts de données), de ce que JDBC représente depuis plus longtemps vis-à-vis des bases de données relationnelles classiques. Toutes deux basées sur le langage Java multiplatesformes, ces interfaces permettent d effectuer divers types de traitements en ligne sur les données et les métas données (informations décrivant une donnée). Développée au départ par l éditeur d outils décisionnels Hyperion, la norme JOlap vient de rallier d autres grands acteurs tels que Sun, Oracle et IBM au sein d un programme ouvert du nom de JCP (Java Community Process). De fait, les spécifications du nouveau standard devraient être prochainement rendues publiques et pourront être intégrées à n importe quelle solution du marché. Avant d accéder à des informations plus détaillées en ligne, les intéressés devront simplement s inscrire au programme JCP sur un site dépendant de Sun. Jointure : En gestion de base de données, une jointure est un lien combinant les enregistrements de deux tables disposant de valeurs correspondantes dans un champ commun. 368

371 Glossaire Ldap : Lightweight Directory Access Protocol (LDAP) est un protocole permettant l accès des annuaires. LDAP est initialement un frontal d accès à des bases d annuaires respectant la norme X.500. Il est devenu un annuaire natif (standalone LDAP) utilisant sa propre base de données, sous l impulsion d une équipe de l Université du Michigan. Matrice de Porter : Modélisation de l'environnement de l'entreprise sous la forme des 5 forces de Porter : concurrents potentiels, acheteurs et clients, subsituts, fournisseurs, concurrents directs. MDX : MultiDimensional expression. Langage d interrogation des bases de données multidimensionnelles. Médiateur (Mediator en anglais) : Logiciel capable de donner une vision intégrée des différentes sources de données de l institution sur demande par des requêtes. Méta données : Une méta donnée est une «donnée sur des données. Middleware (intergiciel en français) : est un ensemble de logiciels ou de technologies informatiques qui servent d intermédiaire entre les applications et le transport des données via le réseau. Ils offrent des services de haut niveau liés aux besoins de communication des applications (temps réel, sécurisation, sérialisation, transaction informatique, etc.). MOODLE : Moodle est une plate-forme e-learning open source. Elle permet la création de communauté d'apprenants autour de contenus pédagogiques. Moniteur (Monitor en anglais) Composant capable d exporter au bon moment les données d une source locale dans le bon modèle. NABUCO : Logiciel de gestion financière et comptable des universités. Objet Opération Evénement : Modèle développé par Odile Foucaut et Odile Thiéry exprimant la dynamique causale car les mêmes causes produisent toujours les mêmes effets. OLAP : OnLine Analytical Processing. Architecture de programme où l aspect décisionnel en temps réel est mis en avant. Peer to Peer : Liaison poste à poste par opposition au modèle client-serveur. Dans ce type de réseau les ordinateurs sont connectés les uns aux autres sans passer par un serveur central. 369

372 Prospective : Mode de recherche d information pour rechercher les nouvelles tendances. Glossaire Proxy : Serveur placé entre la machine de l'internaute et le Net pour faire office de zone tampon. Le Proxy sert à la fois de firewall et de mémoire cache. Pull : Mode classique de la recherche d information sur les réseaux. L utilisateur se connecte sur des serveurs et cherche l information. Push : Mode nouveau de collecte d informations sur Internet. En s abonnant à des fournisseurs de contenu (des chaînes Web), l information arrive directement sur la machine dès qu elle est mise à jour et cela sans que l utilisateur ait besoin d aller la chercher. ROLAP : Relational OLAP. Analyse complexe de données, analyse de données multidimensionnelle efficace. Permet un travail avec des objets d analyse sans connaissance nécessaire sur les structures de données et un accès facile aux données. RSS : acronyme de Really Simple Syndication (syndication vraiment simple), ou de Rich Site Summary (Résumé complet d un site) est un format de syndication de contenu Web. Shibboleth : Shibboleth est un logiciel médiateur «glue» en anglais, c est-à-dire de couches logicielles intercalées entre le réseau et les applications. Ces programmes servent principalement à authentifier et autoriser les usagers de services en ligne, distinction importante dans ce contexte. Le projet a été lancé en 2000, sa version 1.1 est sortie en Slice and dice : Permutation d axes. Littéralement : couper en tranches et dés. SSO : Single Sign-On, dispositif permettant à un utilisateur d accéder à des services divers en ne s identifiant qu une seule et unique fois. Table de faits : Un ensemble de données du même type, permettant de structurer la base multidimensionnelle. Une dimension est parfois appelée un axe. Chaque cellule d une mesure est associée à une seule position de chaque dimension. Temps, pays, produit sont des dimensions classiques. Triggers : (déclencheur) Les triggers sont des ordres de déclenchement d'opérations quand un événement survient sur une table. Ils sont souvent utilisés pour assurer la cohérence des données dans la base, en réalisant des contraintes qui doivent porter sur plusieurs tables. 370

373 Glossaire Workflow management : Technique de management fondée sur le principe du workflow. Le workflow management a pour but d analyser, de modéliser, de simuler et d améliorer les processus. XML : Extensible Markup Language. Standard du consortium W3C considéré à l origine comme un langage facilitant la définition, la validation et le partage de différents formats de documents sur le Web. 371

374 372

375 Sigles 373

376 374

377 Sigles Sigles ACFCI : Assemblée des chambres de commerce et d industrie. ADD : Administration Des Données. Adit : l Agence pour la diffusion de l information technologique. AFDIE : Association française pour le développement de l intelligence économique. ALENA : Accord de libre-échange nord-américain. AMUE : Agence de mutualisation des universités. Apogée : Application pour l organisation et la gestion des étudiants. Arist : Agences régionales d information stratégique et technologique. BDM : Base de Données métier. BPR : Business Process Reengineering. CAC 40 : Cotation Assistée en Continu des 40 plus grandes enterprises françaises en bourse. CEIS : Compagnie Européenne d Intelligence Stratégique. CIGREF : Club Informatique des Grandes Entreprises Françaises. Couperin : Consortium Universitaire de Périodiques Numériques. CPL : Common Public licence. CRM : Customer Relationship Management. DARE/SURF : Digital Academic Repositories. DD : dictionnaire de données. DGSE : Direction générale de la sécurité extérieure. DIG : Digital Imaging Group. DREE : Direction des Relations Economiques Extérieures. 375

378 Sigles DRT SIO : Diplôme de Recherche Technologique Système d Information des Organisations. DSS : Decision Support System. DST : Direction de la surveillance du territoire. DTD : Document Type Definition. EAI : Enterprise Application Integration. EIS : Executive Information System. EML : Educational Modelling Languages. ENT : Espace Numérique de Travail. EPPUN : Espaces pédagogiques pour les universités numériques. EquA 2 te : Explore Query Analyse Annote. ERP : Entreprise Resource Planing. Esup : Environnement numérique de travail d accès intégré aux services pour les étudiants et le personnel de l enseignement supérieur. ETL: Extraction, Transformation and loading. EXIF : EXchangeable Image File. GED : Gestion Electronique des Documents. GIGN : Groupe d intervention de la gendarmerie nationale. GRC : Gestion de Relations Clients. Harpege : Harmonisation de la Gestion des Personnels. HEC : Ecole des Hautes Etudes Commerciales. HIP: Horizon Portail d Information. IMS: Introduction to Metadata Standards. 376

379 Sigles INIST : Institut National de l Information Scientifique et Technique. IPTC: International Press Telecommunications Council. JPEG: Join Photographic Experts Group. Ldap: Lightweight Directory Access Protocol. LMD : Licence, Master, Doctorat. LOLF : Loi organique relative aux lois de finances. LOM: Learning Object Metadata. MARC : Machine Readable Cataloging. MCD : Modèle conceptuel des données. MDX : MultiDimensional expression. MEPD : Modèle pour l Explicitation d un Problème Décisionnel. MIRABEL: Model for Information Retrieval query Annotations Based on Expression Levels. MLD : Modèle logique des données. MODS : Metadata Object Description Schema. MOLAP : Multidimentional On-Line Analytical Processing. MPD : Modèle Physique de Données. MPEG : Moving Pictures and associated audio information coding Experts Group. NABUCO : Nouvelle Approche BUdgétaire et COmptable NewsML : News Markup Language. NITF : News Industry Text Format. OAI-PMH : Open Archive Initiative Protocol for Metadata Harvesting ou Protocole de Collecte de Métas données de l Initiative Archives Ouvertes. 377

380 Sigles OLAP : On Line Analytical Processing. OMT : Object Modeling Technique. Signifie technique de modélisation objet. OOE : Objet Opération Evénement. PRISM : Publishing Requirements for Industry Standard Metadata. RDF : Resources Description Framework. RKMS : RecordKeeping Metadata Schema. ROLAP : Relational On-Line Analytical Processing. RSS : Really Simple Syndication. RUBI 3 : Représentation des Utilisateurs et de leurs Besoins en Information lors de l Interrogation après Identification. RUBICUBE : Niveau modélisation : Repérage, Utilisateur, Besoins, Identification, Classification, Usages, Bases métiers, Elaboration. Niveau application : Récupération, Utilisateur, Besoins, Intégration, Construction, Usinage, Brique, Enrichissement. Niveau méta modélisation : Référentiel, Utilisateur, Besoins, Interopérabilité, Conception, Urbanisation, Bénéfice, Emergence. SCI : Système de Collecte et d Intégration. SCIP : Society of Competitive Intelligence Professionals. Scorm : Sharable Content Object Reference Metadata. SDP : Système de Diffusion et de Présentation. SGBD : Système de Gestion de Bases de Données. SGDN : Secrétariat Général de la Défense Nationale. SIAD : Systèmes d Aide à la Décision Interactifs ou Intelligents. SID : Système d Information Décisionnel. SID : Systèmes d Information Documentaire. SIDOC : Système d Information documentaire. 378

381 Sigles SIE : Système d Intelligence Economique. SIGB : Système Intégré de Gestion de Bibliothèque S-IS : système d «informations stratégiques» SI-S : «système d information» stratégique SQL : Structured Query Language. SRU : Search and Retrieve URL Service. SRW : Search Retrieve Web Service. SSO : Single Sign-On. SUDOC : Système Universitaire de Documentation. TIC : Technologies de l Information et de la Communication. UML : UnifiedModeling Language/Langage unifié pour la modélisation. WISP : Watcher-Information-Search-Problem. XML : Extensible Markup Language ou langage de balisage extensible. XMP : Extensible Metadata Platform. 379

382 380

383 Bibliographie 381

384 382

385 Bibliographie Bibliographie [O1NET, 2005] Alain juillet (Intelligence économique) [En ligne] (Page consultée le 16 novembre 2005). [ACFCI, 1996] pratique). ACFCI. Veille industrielle. Le guide (L Intelligence Economique en [ACFCI, 1997] ACFCI. Le Livre blanc sur l Intelligence Économique, [ACHARD et BERNAT, 1998] d emploi, Ed ADBS. Achard P., Bernat J.-P. L intelligence économique, mode [ADAE, 2004] ADAE : Le répertoire des schémas XML de l administration [En ligne], (Page consultée le 1 er mai 2004). [AGRAVAL et GUPTA et SARAWAGI, 1997] Modeling Multidimensional Databases, ICDE 97. Agrawal R., Gupta A., Sarawagi A., [AIMS, 1996] Acte de la Conférence Internationale de Management Stratégique (AIMS), Lille, [AKOKA et COMYN-WATTIAU, 1999] Akoka J., Comyn-Wattiau I. Rétro-conception des datawarehouses et des systèmes multidimensionnels. Congrès Inforsid 1999, La Garde. [AKOKA, 2002] Akoka, J. Entrepôts de données et bases multidimensionnelles, Paris : Lavoisier, [ALLAIN-DUPRE et DUHARD, 1997] Allain-Dupré, P. et Duhard, N. Les armes secrètes de la décision. La gestion de l information au service de la performance économique, Gualino Ed, [AMUE, 2001] Agence de modernisation des universités, Les rencontres de l Agence «Portail étudiant, intranet pédagogique, bureau virtuel : quel environnement de travail pour les étudiants?» 4 décembre p. [AMUE, 2002] Agence de modernisation des universités et des établissements, Séminaire Harpège, Présentation de l univers Business Objects d Harpège, 4 et 5 juin

386 Bibliographie [AMUE, 2003] Agence de mutualisation des universités, [En ligne] (Page consultée le 24 février 2003). [AMUE, 2004] Agence de mutualisation des universités, [en ligne] (Page consultée le 10 septembre 2004). [ANDRE, 2005] André F. Valoriser la production scientifique des laboratoires : enjeux et dimension internationale [En ligne] =0 (Page consultée le 16novembre 2005). [ANTOINE, 1996] Antoine J. Valeurs de sociétés et stratégies des entreprises, PUF, [ANTOINE et AVELIN et BOURGES, 2003] Antoine J.-M., Avelin, J.-G., Bourges R. ESUP Portail : un ENT universitaire. JRES [ARGYRIS et SCHON, 1978] Argyris C., Schon D. Organizational learning : a theory of action perspective, Adison Wesley, [ARIADNE] ARIADNE : Alliance of Remote Instructional Authoring and Distribution Networks for Europe, [ARPAGIAN et TAVAILLOT, 2004] Arpagian N., Tavoillot P.-A. Un moteur d efficacité pour les entreprises. DSI, 2004, vol.10. [ARPAGIAN, 2004a] Arpagian N. IE à la française : une mosaïque d acteurs aux parcours hétéroclites. DSI, 2004, vol.10. [ARPAGIAN, 2004b] Arpagian N. Une opportunité à saisir pour les services informatiques. DSI, 2004, vol.10, novembre. [ASSADI, 1998] Assadi D. Intelligence économique sur Internet. Etudes de marché et veille concurrentielle, Publi-Union, [BABINET, 1992] Babinet C. Le devoir de vigilance. De la nécessité du renseignement économique, Denoël, [BALPE et SALEH et NANARD, 1997] hypermédias. Hermès, Balpe J.-P., Saleh I., Nanard M. Hypertextes et 384

387 Bibliographie [BARALIS et PARABOSCHI et TENIENTE, 1997] Baralis E., Paraboschi S., Teniente E. Materialized view selection in a multidimensional database, Proc. VLDB 97. [BAUMARD, 1991] Baumard P. Stratégie et surveillance des environnements concurrentiels, Masson, [BAUMARD, 1996] Baumard P. Prospective à l usage du manager [BAZSALICZA et NAIM, 2001] Eyrolles, Bazsalicza M., Naïm P. Data Mining pour le Web, [BELLAHSENE, 1998] Bellahsene Z. View Adaptation in Data Warehousing Systems, Proceedings of the 9 th International Conference on Database and Expert Systems - DEXA 98. [BERDOT, 2004a] Berdot V. Les métas données retracent l histoire collaborative d un document. 01 informatique, 2004, n 1787, p.16. [BERDOT, 2004b] Berdot V. Quand le textmining soigne la réputation des entreprises. 01 informatique, 2004, n 1779, p.28. [BERDOT, 2004c] Berdot V. Quand XML fluidifie le traitement des candidatures. 01 informatique, 2004, 5 novembre, p. 33. [BERTRAND, 2005] BERTRAND A. Le Système d information documentaire de l Université de Technologie de Compiègne, Réunion des Directeurs de Bibliothèques, 2005, 25 janvier. [BESSON et POSSIN, 1996] Besson B., Possin J.-C. Du renseignement à l intelligence économique. Détecter les menaces et les opportunités pour l entreprise, Dunod, [BESSON et POSSIN, 1998] Besson B., Possin J.-C. L audit de l intelligence économique. Mettre en place et optimiser un dispositif coordonné d intelligence collective, Dunod, [BESSON, 1994] Besson B. Introduction à l intelligence économique, CISCP, Chlorofeuilles, [BISEUL, 2004] Biseul X. Les technologies de l information obligent le manager à prouver sa valeur ajoutée. 01 informatique, 2004, n 1784, p.29. [BLOCH, 1996] Bloch A. L intelligence économique. Economica

388 Bibliographie [BORDAGE, 2004] Bordage F. Les bases de données bientôt gratuites? 01 informatique, 2004, n 1783, p.24. [BOTBOL et VERDIER, 2004] l intelligence économique, Botbol M., Verdier I. France : Le Top 100 de [BOUAKA et DAVID, 2002] Bouaka N., David A., et al. Contribution à la connaissance des facteurs explicatifs d un problème d un décideur dans un contexte d intelligence économique. Rapport interne LORIA, 2002, Avril, 10 p. [BOUAKA et DAVID, 2003] Bouaka N., David A. Modèle pour l explicitation d un problème décisionnel : un outil d aide à la décision dans un contexte d intelligence économique. IERA 2003, INIST-CNRS, Nancy. [BOUAKA, 2004] Bouaka N. Développement d un modèle pour l explicitation d un problème décisionnel. Un outil d aide à la décision dans un contexte d intelligence économique. Nancy, Université Nancy 2, [BOUBKER et REDOUANE, 2004] Boubker S, Redouane E.-Y. Analyse et conception d un système d information avec la méthode MERISE : cas d une bibliothèque universitaire, Ecole des sciences de l information RESI, n 14, [BOULLIER, 2006] Boullier M. La conception de l information devient documentaire, [BOUNFOUF, 1998] Bounfouf A. Le management des ressources immatérielles. Maîtriser les nouveaux leviers de l avantage compétitif, Dunod, [BOUSSAID, 2003] BOUSSAID O. Entreposage et fouille de données, Toulouse : Cépaduès, [BOYER et NOMINE, 2001] Boyer A., Nominé B. Managing new educative technology in a medium size university, In 20 th ICDE World Conference on Open Learning and Distance Education. (Düsseldorf, Germany), [BRET et SOULE-DUPUY et ZURFLUH, 2000] Bret F., Soule-Dupuy C., Zurfluh G. Outils méthodologiques pour la conception de bases de données décisionnelles orientées objet, LMO 2000, St Hilaire (Canada), Janvier

389 Bibliographie [BRET et TESTE, 1999] Bret F., Teste O. Construction Graphique d Entrepôts et de Magasins de Données, Actes du XVIIème Congrès INFormatique des ORganisations et Systèmes d Information et de Décision - INFORSID 99, La Garde. [BRETT, 2006] Brett G. Shibboleth enabled applications and services. [En ligne] (Page consultée le 19 mars 2006). [BRETON, 1987] Breton P. Une histoire de l informatique, Paris, Éditions La Découverte, 1987, 261 p. (Coll. Points/Science). [BRETON, 1989] Breton P. Proulx S. L explosion de la communication, La Découverte, [BRETON, 1992] Breton P. L utopie de la communication, La Découverte, [BRIARD, 2000] Mémoire de DRT SIO, Briard B. MAUD : une méthode pour auditer la qualité des données. [BRONCKART, 1985] Delachaux & Niestlé, Bronckart J.-P. Le fonctionnement des discours, Paris, Lausanne, [BUENO et DAVID, 2000] Bueno D., David A. Processing the user model in IRS. Knowledge-organization, [BUZYDLOWSKI et SONG et HASSEL, 1998] Buzydlowski J.W., Song I.Y., Hassell L. A Framework for Object-Oriented On-Line Analytic Processing, DOLAP 98, Bethesda (Maryland, USA), 7 November [CAMU et GAYOT, 2004] Camu J.-P., Gayot F. Projet d'application. Construction et exploitation d'un hypercube sur les maquettes d'enseignements et diplômes de l UFR MI. Nancy : DESS ACSI Université Nancy 2, p. [CANSELL, 2003] d'une dynamique d'ie, IERA Cansell P. Actions et méthodes d'ie à Giat Industries : acteurs et outils [CANTEGREIL, 1991] Cantegreil F. Vigilance et stratégie. Les nouvelles règles de l entreprise, Ed. Comptables Malherbes,

390 Bibliographie [CAP, 2003] Cap Gémini Ernst & Young, Etudes préalables à l élaboration d un système d information de gestion des établissements, [CARAYON, 2003] Carayon B. Intelligence économique, compétitivité et cohésion sociale. Rapport au premier ministre, [CHAIX et VELY et VISE, 2006] Chaix T., Vely J., Vise B. Projet d'application : construction et exploitation d'un hypercube, Nancy : Master MIAGE Audit et conception des Systèmes d'information, p. [CHAMPIN et PRIE, 2002] Champin P.-A., Prie Y. MUSETTE : un modèle pour réutiliser l expérience sur le web sémantique. 2002, [En ligne] (Page consultée le 24 février 2003). [CHARTRON, 2002] Chartron G. Les Chercheurs et la documentation numérique : nouveaux services et usages, Cercle de la librairie, [CHAUDHURI et DAYAL, 1997] Chaudhuri S., Dayal U. An Overview of Data Warehousing and OLAP Technology, ACM SIGMOD Record, 1997, vol. 26, n 1. [CHAWATHE, 1994] Chawathe S., Garcia-Molina H., Hammer J. The TSIMMIS Project: Integration of Heterogeneous Information Sources, In Proceedings of IPSJ Conference, pp. 7-18, Tokyo, Japan, October [CHEVRIER, 2004] Chevrier C. Comment la DSI reprend en main les outils de travail collaboratif. 01 informatique, 2004, n 1783, p.16. [CHRISMENT, 2004] CHRISMENT C. Fouille, transactions, évaluation dans les bases de données, Paris, Lavoisier, [CIGREF, 2003] Intelligence économique et stratégique, les systèmes d information au cœur de la démarche. CIGREF, [CLAMEN, 1997] Clamen M. Le lobbying et ses secrets. Guide des techniques de l influence, Dunod, [CLERC, 2004] Clerc P. Les modèles d intelligence économique dans le monde. 8 p. 388

391 Bibliographie [COAD et YOURDON, 1991] Coad P., Yourdon E. Object-oriented analysis, Prentice- Hall International, second edition, [COLLETIS, 1997] Colletis. Intelligence économique : vers un nouveau concept en analyse économique? Revue d intelligence économique, n 1, [COMMISSARIAT, 1990] Commissariat Général au Plan. Information et compétitivité, La Documentation française, [COURTIAL, 1990] Courtial J.-P. Introduction à la scientométrie. De la bibliométrie à la veille technologique, Anthropos, [COUZINET, 2005] Couzinet, V. Intelligence économique et sciences de l information et de la communication : quelles questions de recherche? ISKO-France 2005, Nancy. [DALBERA et SEVIGNY, 2001] Dalbéra J.-P., Sévigny M. SDX, Système Documentaire en XML : une plate-forme ouverte et modulaire pour la diffusion et la gestion d ensembles de documents XML. Culture et recherche n 83, mars-avril [DALBIN, 2003] Dalbin S. La modélisation : pourquoi l intégrer dans les systèmes d information documentaire? La revue Documentaliste - Sciences de l information, 2003, vol. 40, n 3, p [DAVID et BUENO, 2001] David A., Bueno D., et al. Case base reasoning, user model & irs. SCI 2001, Orlando, Florida, USA. [DAVID et RICARDO, 2002] David B., Ricardo C., et al. METIORE: A publications reference for the Adaptive hypermedia community; AH 2002 : adaptive hypermedia and adaptive web-based systems : Malaga, May Lecture notes in computer science 2002, n 2347, p [DAVID et THIERY, 1990] David A, Thiéry, O. Processus EXPRIM, Image et IA pour un EIIAO individualise (Enseignement par l Image Intelligemment Assistee par Ordinateur). 1990, 200 p. [DAVID et THIERY, 2001] David A., Thiéry O. Prise en compte du profil de l utilisateur dans un système d information stratégique, In veille stratégique scientifique et technique - VSST 2001, Barcelone, octobre

392 Bibliographie [DAVID et THIERY, 2002] David A., Thiéry O. Application of «equa2te» architecture in economic intelligence, 2002, [en ligne] (Page consultée le 24 février 2003).» [DAVID, 1998] David A. Modélisation de données, cours, [DAVID, 1999] DAVID Amos. Modélisation de l utilisateur et recherche coopérative d information, cours, [DAVID, 2000] David A. Outils IST-IE Information Scientifique et Technique Intelligence Économique, cours, [DAVY, 2004 ] 2004, n 1783, p.20. Davy P. La persistance avec Service Data Objects. 01 informatique, [DE GUERNY et DELBES, 1993] De Guerny J., Delbes, R. Gestion concurrentielle, pratique de la veille, Ed. Delmas, [DE LA PASSADIERE et JARRAUD, 2004] De la Passadière B., Jarraud P. ManUel, un profil d application de LOM pour C@mpuSciences. Pré-publication de la revue Sticef.org, 37 p., [DE MENTQUE CLIQUOT, 1993] De Mentque Cliquot, C. VTT, L Annuaire des professionnels de la veille et du transfert de technologies, A jour, [DE ROSNAY, 1975] De Rosnay J. Le macroscope, Seuil, [DE ROSNAY, 1995] millénaire, Seuil, De Rosnay J. L homme symbiotique : regards sur le troisième [DEBRAY, 1991] Debray R. Cours de médiologie générale, Paris, Éditions Gallimard, [DELBECQUE, 2004] Delbecque, E. Intelligence Économique et Management Stratégique. [En ligne] [DESFORGES, 2000] Desforges T. L Evolution des systèmes d information distribués : convergence sur les services et la relation utilisateur. AIM 2000, Montpellier, 8-10 novembre

393 Bibliographie [DESNOS, 2000] Desnos J.-F. Projet «Entrepôt de Données», Agence de Modernisation des Universités, 15 mai 2000, Assises du CSIESR. [DESNOS, 2002] Desnos J.-F. Projet Entrepôt de données, 2002 [en ligne] (Page consultée le 10 septembre 2004). [DESVALS, 1992] Desvals H. La veille technologique. L information scientifique, technique et industrielle, Dunod, [DOKEOS] Dokeos : Open Source Learning & Collaboration Management, [DOU, 1995] Dou H. Veille technologique et compétitivité. L intelligence économique au service du développement industriel, Dunod, [DOYEN, 1998] Doyen J. Définition d un tableau de bord de l emploi au Luxembourg, Mémoire de DRT SIO, CRP-CU, [DUBOIS, 2004] Dubois A.-C. LMD et formation à la recherche documentaire en bibliothèque universitaire : rupture ou continuités. Mémoire d étude janvier p. [DUCLOY, 2002a] Ducloy J. Cours IUT Paris [En ligne] (Page consultée le 24 février 2003). [DUCLOY, 2002b] Ducloy J. Cours IUT Paris 2002, [en ligne] (Page consultée le 10 septembre 2004) [DUCLOY, 2005] Ducloy J. Bibliothèque des savoirs en élaboration et métas données [En ligne] =0 (Page consultée le 16 novembre 2005). [DUPRE, 2002] Dupré J. Renseignements et entreprises. Intelligence économique, espionnage industriel et sécurité juridique. Paris, Lavauzelle, [DUVEAU-PATUREAU, 2003] Duveau-Patureau V. Le Nouvel enseignant-chercheur : un pédagogue créatif autour de son expertise. [En ligne] 391

394 Bibliographie (Page consultée le 24 février 2003). [ENCORA] ENCORA : Environnement Numérique du Campus Ouvert Rhône Alpes, [ESCARPIT, 1990] Escarpit R. Théorie générale de l information et de la communication, Hachette, [ESSENTIEL, 2003] L Essentiel d Unified Modeling Language (UML), [ESUP] Esup portail : Environnement numérique de travail d accès intégré aux services pour les étudiants et le personnel de l enseignement supérieur, [En ligne] (Page consultée le 10 septembre 2004). [FIEVET, 1993] Fiévet G. De la stratégie. L expérience militaire au service de l entreprise, Interéditions, [FLUHR, 2001] Fluhr C. Filtrage et résumé automatique de l information sur les réseaux, 3 e Congrès du chapitre français de l ISKO, 5-6 juillet 2001, Université de Paris X, 2001, p [FOUCAUT et THIERY, 1996a] Foucaut O., Thiéry O. L Evolution des méthodes de conception des systèmes d information stratégiques. Conférence invitée au Symposium sur les Systèmes d Informations Stratégiques, Luxembourg, [FOUCAUT et THIERY et SMAILI, 1996b] Foucaut O., Thiéry O., Smaili K. Conception des systèmes d information et programmation événementielle : de l étape conceptuelle à l étape d implantation, InterEditions, [FOUCAUT et THIERY, 1998] Foucaut O., Thiéry, O. Un modèle unique, le modèle OOE, pour la conception des systèmes d information : de l étape conceptuelle à l étape de programmation. Lettre de l ADELI, 1998, avril n 31. [FOUCAUT et SMAILI et THIERY, 2005a] Foucaut O., Smaili K., Thiéry O. TP Powerplay (Version 7), Exploration d une base multidimensionnelle. Nancy, MIAGE MSG,

395 Bibliographie [FOUCAUT et SMAILI et THIERY, 2005b] Foucaut O., Smaili K., Thiéry O. TP Powerplay Cognos (Version 7), Création d une base multidimensionnelle : Les Comptoirs. Nancy, MIAGE MSG, [FOULONNEAU, 2005] Foulonneau M. Cyberinfrastructures pour l enseignement et la recherche, centres de ressources virtuels et bibliothèques numériques [En ligne] =0 (Page consultée le 6 novembre 2005). [FOWLER et SCOTT, 1997] Fowler M., Scott K. UML Distilled, applying the standard object modeling language, Addison Wesley, [FRANCO et DE LIGNEROLLES, 2000] Franco, J.-M., De Lignerolles S. l entreprise grâce au data Warehouse, Eyrolles, Piloter [FRANCO, 1997a] Franco J.-M. Le data warehouse : le data mining, Paris, [FRANCO, 1997b] Eyrolles, Franco J.-M. Le Data Wharehouse : objectifs, définitions, architectures, [GARCIA-MOLINA et LABIO et YANG, 1998] Garcia-Molina H., Labio W. J., Yang J. Expiring Data in a Warehouse, In Proceedings of the 24 th VLDB Conference - VLDB 98, New York (USA), August, [GARADARIN, 2005] Gardarin, G. Data warehouse. [En ligne] (Page consultée le 29 janvier 2006) [GLAIS, 1992] firmes, Litec, Glais, M. Économie industrielle. Les stratégies concurrentielles des [GOGLIN, 2001] dataweb, Paris, Goglin J.-F. La construction du datawarehouse : du datamart au [GOLDFINGER, 1994] Odile Jacob, Goldfinger C. L Utile et le Futile. L économie de l immatériel, 393

396 Bibliographie [GOUARNE, 1998] Gouarné J.-M. Le Projet décisionnel : enjeux, modèles et architectures du data warehouse, Eyrolles, [GRENOBLE, 2005] GRENOBLE UNIVERSITES : Construire la brique documentaire des Environnements Numériques de Travail. [En ligne] pagelibre/ (Page consultée le 31 Octobre 2005). [GUILHON, 2003] PME, Editions Economica, Guilhon A. Le processus d intelligence économique et l identité de la [GUILHON et LEVET, 2003] l économie de la connaissance. Economica, Guilhon B., Levet J.-L. De l intelligence économique à [GUISNEL, 1995] Ed. De la Découverte, Guisnel J. Guerres dans le Cyberespace. Services secrets et Internet, [GUPTA et MUMICK, 1999] Gupta H., Mumick I.S. Selection of Views to Materialize Under a Maintenance-Time Constraint, In Proceedings of the International Conference on Database Theory - ICDT 99, Jerusalam (Israel), January [GYSSEN et LAKSHMANAN, 1997] Gyssen M., Lakshmanan L.V.S. A Foundation for Multi-Dimensional Databases, In Proceedings of 23 rd International Conference on Very Large Data Bases - VLDB 97, Athens (Greece), August 25-29, [HARBULOT et BAUMARD, 1997] Harbulot C., Baumard P. Perspective historique de l intelligence économique. Revue d intelligence économique, 1997, n 1. [HARBULOT, 1990] Harbulot C. Techniques offensives et guerre économique. Etude Aditech-CPE, Aditech. n 131, [HARBULOT, 1992] Harbulot C. La machine de guerre économique. Etats-Unis, Japon, Europe., Inter-éditions, [HASSID et JACQUES-GUSTAVE, 1997] Hassid L., Jacques-Gustave P., et al. Les PME face au défi de l intelligence économique, Dunod, [HENRI, 1998] Henri B. Le renseignement. Un enjeu de pouvoir. Economica

397 Bibliographie [HUNT et ZARTARIAN, 1990] Hunt C., Zartarian V. Le renseignement stratégique au service de votre entreprise. L information pour gagner, First, [HUYN, 1997] Huyn N. Multiple-View Self-Maintenance in Data Warehousing Environments, In Proceedings of 23 rd International Conference on Very Large Data Bases - VLDB 97, Athens (Greece), August [IMPACT, 2002] L Impact du web sur les bases de données de l entreprise, [En ligne] (Page consultée le 24 février 2003). [INFORMATION, 2003] Information interaction intelligence : une revue en sciences du traitement de l information = a journal in the sciences of information engineering. Toulouse : Epodes, [INMON, 1997] Inmon W.-H., Zachman John A., Geiger Jonathan G. Data Stores, Data Warehouses and the Zachman Framework, [INMON, 2002] Inmon W.-H., Building the data warehouse, New York, [JACQUES-GUSTAVE et MOINET, 1995] Jacques-Gustave P., Moinet N. Intelligence économique et stratégies des PME. Une étude de cas sur l ARC Poitiers Futuroscope Chatellerault, Défense Conseil International, [JACQUOT, 2004] Jacquot T. Le CHU de Besançon mise sur le tout-xml en vue du dossier médical «patient». 01 Réseaux, 2004, n 144, p [JAKOBIAK, 1988] Jakobiak F. Maîtriser l information critique, Ed. d Organisation, 1988, 225 p. [JAKOBIAK, 1990] Jakobiak, F. Pratique de la veille technologique, Ed. d Organisation, [JAKOBIAK, 1992] Jakobiak F. Exemples commentés de veille technologique, Ed. d Organisation, [JAKOBIAK, 1994] Jakobiak F. Le brevet source d information, Dunod,

398 Bibliographie [JAKOBIAK, 1998] Jakobiak F. L intelligence économique en pratique, Ed d Organisation, [JUILLET, 2004] Juillet A. L Intelligence économique exige un outil informatique performant. 01 informatique, 2004, n [KAMINSKY, 2004] Kaminsky D. France : le top 100 de l intelligence économique. Bases, 2004, n 201. [KETTANI et MIGNET, 1998] Kettani N., Mignet D. De Merise à UML, Eyrolles, [KIMBALL, 1996] Kimball R. The data warehouse toolkit, John Wiley and Sons, [KIMBALL, 2000a] Kimball R. Concevoir et déployer un data warehouse, guide de conduite de projet, Eyrolles, [KIMBALL, 2000b] Kimball R., Merz R. Le Data webhouse, analyser les comportements client sur le web, Eyrolles, [KIMBALL, 2003] Kimball R. Ross M. Entrepôts de données : guide pratique de modélisation dimensionnelle, Paris : Vuibert, [KISLIN et DAVID et PEGUIRON, 2003] Kislin P., David A., Peguiron F. Caractérisation des éléments de solutions en recherche d information : conception d un modèle dynamique dans un contexte décisionnel, ISKO2003, Grenoble. [KISLIN et DAVID, 2002] Kislin P., David A., et al. A model of information retrieval problem in economic intelligence context. SCI 2002, Orlando, Florida, USA, july [KISLIN et DAVID, 2003] Kislin P., David A. De la caractérisation de l espace-problème décisionnel à l élaboration des éléments de solution en recherche d information dans un contexte d intelligence économique : le modèle WISP. IERA 2003, INIST-CNRS, Nancy. [KNAUF et DAVID, 2004] Knauf A., David A., et al. Vers une meilleure caractérisation des rôles et compétences de l infomédiaire dans le processus d intelligence économique ; VSST 2004 : veille stratégique scientifique & technologique : systèmes d information élaborée, bibliométrie, linguistique, intelligence économique : Toulouse, octobre , vol 2, p

399 Bibliographie [LACOSTE et THUAL, 2002] Paris, Lavauzelle, Lacoste A., Thual F. Services secrets et géopolitique. [LAINE-CRUZEL, 2001] Laine-cruzel S. Vers un nouveau positionnement des professionnels de l information : quelle valeur ajoutée, pour quels systèmes? ISKO-France 2001, Nanterre. [LAINEE, 1991] Lainée F. La veille technologique. De l amateurisme au professionnalisme, Eyrolles, [LAPERCHE, 1998] Laperche B. La firme et l innovation. Innover pour conquérir, Ed. L Harmattan, [LE CANNELLIER, 2006] Le Cannellier C. Les solutions Open Source pour le Décisionnel, EURIWARE Solutions Linux Cycle Gestion d Entreprise, CNIT Paris La Défense, 31 janvier 2006, &startid=11403&classeur=2122&phpsessid=b68d8e97e461773c3bfd518a45707ff9 (Page consultée le 19 mars 2006). [COADIC, 1997] sais-je?). Coadic Y.-F. La science de l information, 2 e édition, PUF, 1997, (Que [LE COADIC, 1997] Le Coadic Y.-F. Usages et usagers de l information, Nathan, [LE COADIC, 1998] Le Coadic Y.-F. Le besoin d information : Formulation, négociation, diagnostic, ADBS, [LE MOIGNE, 1974] Le Moigne J.-L. Les systèmes de décision dans les organisations, Editions PUF, [LEFEBURE et VENTURI, 2001] Lefébure R., Venturi G. Data Mining, Gestion de la relation Client, Personnalisation des sites Web, Eyrolles, [LESCA et LESCA, 1994] l entreprise, Lesca H., Lesca E. Veille stratégique. L intelligence de [LESCA et LESCA, 1995] Lesca H., Lesca E. Gestion de l information : qualité de l information et performances de l entreprise, Editions Litec,

400 Bibliographie [LESOURNE et STOFFAES, 1996] Lesourne J., Stoffaes C. La prospective stratégique d entreprise. Concepts et études de cas, Interéditions, [LEVET et PATUREL, 1996] d intelligence économique, Levet J.-L., Paturel R. L intégration de la démarche [LEVET et TOURRET, 1992] Levet J.-L., Tourret J.-C. La révolution des pouvoirs. Les patriotismes économiques à l épreuve de la mondialisation, Economica, [LEVY, 1997] Levy P. Cyberculture, Odile Jacob, [LEVY, 1987] Levy P. La machine univers, création, cognition et culture informatique, La Découverte, [LEVY, 1990] Levy P. Les technologies de l intelligence : l avenir de la pensée à l ère informatique, Editions la découverte, [LEVY, 1991] Levy P. L idéographie dynamique, vers une imagination artificielle? La Découverte, [LEVY, 1994]Levy P. L intelligence collective, Paris, Éditions La Découverte, [LEVY, 1995]Levy P. Qu est-ce que le virtuel?, La Découverte, [L HUILLIER, 1995] L Huillier H. La métamorphose de l unité documentaire. Comment l unité documentaire peut-elle s accorder à l évolution de son environnement? Termes du problème, orientations concrètes et outils pratiques, Lynx-Edicom, [LOISEAU et GENEST] Loiseau S., Genest D. Modèles de connaissances graphiques. [En ligne] (Page consultée le 24 février 2003). [LORIA, 2005] Team SITE : Modeling and Development of Economic Intelligence Systems ; Activity Report LORIA 2005, 18 p. [LUPOVICI, 1999] Lupovici C. Identification des ressources sur Internet et métas données : diversité des standards. Documentaliste-sciences de l information, 1999, vol. 36, n 6, p

401 Bibliographie [MALON, 1999] Malon A. Eléments méthodologiques pour la construction des bases de données multidimensionnelles, Application dans le domaine du pilotage en milieu bancaire. Mémoire de DRT SIO, SNVB, [MANUEL] Manuel d utilisation de l infocentre PILOTAGE, c. [MARIANNA et DAVID, 2000] Marianna M., David A., et al. Automatisation des recherches sur Internet au moyen d agents intelligents, 2000, 70 p. [MARTI et MARTINET, 1995] yeux et les oreilles de l entreprise, Ed. D Organisation, Marti Y.-M., Martinet B. L intelligence économique. Les [MARTINET et RIBAULT, 1989] Martinet B., Ribault J.-M. La veille technologique, concurrentielle et commerciale, Ed. D Organisation, [MARTRE, 1994a] Martre, H. Information et compétitivité, La Documentation française, [MARTRE, 1994b] Martre H., Levet J.-L., et al. Rapport dit «Martre» : Intelligence économique et stratégie des entreprises, Rapport du Commissariat Général au Plan, Paris, La Documentation Française, [MASINI et NAPOLI, 1989] Masini G., Napoli A., et al. Les langages à objets : langages de classes, langages de frames, langage d acteurs, InterEdition, [MATHIEUX, 2004] Mathieux B. Les services publics sur Internet plaisent aux français. 01 informatique, 2004, n 1781, p.30. [MAYERE, 1990] Mayère A. Pour une économie de l information, Ed. du CNRS, 1990 ; [MAYERE, 1997] économiques, Ed. L Harmattan, Mayère A. La société informationnelle. Enjeux sociaux et approches [MCLUHAN, 1977] Mcluhan M. La galaxie Gutenberg face à l ère électronique, Paris, Gallimard,

402 Bibliographie [MEN, 2001] MEN DT Bureau B3, Competice outil de pilotage par les compétences des projets tice dans l enseignement supérieur, [En ligne] (Page consultée le 24 février 2003). [MINC et NORA, 1978] Minc A, Nora. S. L informatisation de la société, Points Seuil, [MODELE] Modèle de recherche d information collaborative. [En ligne] (Page consultée le 24 février 2003). [MONTECRISTO] MonteCristo : Portail de services aux étudiants et personnels, [MOODLE, 2005] Moodle : a free open source course management system for online learning. [En ligne] (Page consultée le 23 octobre 2005). [MORGAT, 1995] d Organisation, Morgat P. Audit et gestion stratégique de l information, Ed. [MORIN, 1992] Morin E. La connaissance de la connaissance, Seuil, [MORIN, 1997] Morin E. La méthode, Seuil, [MORIN, 1999] Morin E. L intelligence de la complexité, L Harmattan, [MOUVEMENT] Mouvement Freinet, [MUCKENHIRN, 2003] Muckenhirn P. Le Système d information décisionnel, construction et exploitation, Lavoisier, [MULLER, 1997] Muller P.-A. Modélisation objet avec UML, Eyrolles, [MULLER] Muller P.-A. Représentation des vues d architecture avec UML, [NATAF, 2002] Nataf J.-B. L Entrepôt de Données, partie prenante du développement d un Système d Information de l université, Intervention du 27 Mars

403 Bibliographie [NATAF, 2001] Nataf J.-B. Structure de l entrepôt de données de pilotage, Avril 2001 [En ligne] (Page consultée le 15 avril 2004). [NIEUWBOURG, 2005] Nieuwbourg P. Talend développe un ETL français en open source, mardi 20 décembre [En ligne] ETL-francais-en-open-source_a1093.html?voir_commentaire=oui (Page consultée le 19 mars 2006). [NOMINE, 2004] Nancy, Nominé B. ESUP portail : espace numérique de travail pour tous, [NOURRISSIER et THIERY, 2002] Nourrissier P., Thiéry O. De l élaboration d un site web à l extraction de données, In Journées francophones d extraction et de gestion des connaissances, EGC 2002, Montpellier. [OAI, 2005] Open archives initiative : tolls. [En ligne] (Page consultée le 19 mars 2006). [OAIP] Open Archives Initiative - Protocol for Metadata Harvesting - v.2.0. [En ligne] (Page consultée le 26 Février 2006). [OFFICE] Office Québécois de la langue française. Le Grand dictionnaire terminologique du Québec. [En ligne] (Page consultée le 24 février 2003) [ORBESON, 1997] Orbeson P. L Internet et l intelligence économique, Ed. d Organisation, [OUBRICH, 2003] Oubrich M. Processus d intelligence économique : transformer l information en connaissance, AIM 2003, Grenoble. [PACH et PARAPONIARIS, 1993] Paché C., Paraponiaris C. L entreprise en réseau, PUF, 1993, Que-sais-je? [PADIS, 2004] Padis M.-O. L Intelligence économique en France : les incertitudes du marché. Archimag,

404 Bibliographie [PANET et LETOUCHE, 1994] Panet G., Letouche R. Merise/2 : Modèles et techniques avancés, Les Editions d Organisation, [PATEYRON, 1998] Pateyron E. La veille stratégique. Economica, [PEAUCELLE, 1999] PUF, Peaucelle J.-L. Les Systèmes d information : la représentation [PEGUIRON et DAVID et THIERY, 2003] Peguiron F., David A., Thiéry O. Intelligence économique dans un cadre universitaire intégrant la modélisation de l utilisateur, IERA 2003, Nancy. [En ligne] (Page consultée le 15 avril 2004). [PEGUIRON et KISLIN et BOUAKA, 2003] Peguiron F., Kislin P., Bouaka N. Activitybased classification of university actors for the construction of a domain-oriented data warehouse, SCI2003. [En ligne] (Page consultée le 15 avril 2004). [PEGUIRON et THIERY, 2004] Peguiron F., Thiéry O., et al. Modéliser l acteur dans le système d information stratégique d une université ; VSST 2004 : veille stratégique scientifique & technologique : systèmes d information élaborée, bibliométrie, linguistique, intelligence économique : Toulouse, octobre ; vol 2, [PEGUIRON et THIERY, 2005] Peguiron F., Thiéry O., Modélisation des acteurs et des ressources : application au contexte d un SIS universitaire, ISKO-France 2005, Nancy, [PEGUIRON, 2001] Peguiron F. Accès à l information sur Internet, pratiques et tendances des utilisateurs : dans un contexte de documentation électronique, Université de Nancy-Metz, [En ligne] [PICARD, 1991] Picard D. La veille sociale. Prévoir et gérer la conflictualité industrielle, Librairie Vuibert, [POLITY, 1999] Polity Y. Le comportement des chercheurs dans leur activité, 6 pages, URL :

405 Bibliographie [POLITY, 2001] Polity Y. Du paradigme orienté-usager au paradigme orienté-acteur. GREMI Groupe de Réflexion sur l Enseignement des Méthodologies de l Information, 22 mars [PORTER, 1989] Porter M. Choix stratégiques et concurrence. Economica, [PORTER, 1993] Porter M. L avantage concurrentiel des nations. Economica, [POTTIER, 2002] Pottier S. Mise en place de méthodes et d outils pour le processus d extraction de donnée en vue d analyse décisionnelle. La méthode RADHE. Loria. Nancy, Université Nancy 2. Diplôme de recherche technologique, 2002, 87 p. [PRENSKY, 2004] Prensky M. Capturing the Value of Generation Tech Employees. [En ligne] (Page consultée le 12 avril 2006). [QUASS et GUPTA et MUMICK, 1996] Quass D., Gupta A., Mumick I., Making Views Self-Maintainable for Data Warehousing, In Proceedings of the Conference on Parallel and Distributed Information Systems, Miami Beach (Florida, USA), December [QUESTER, 2004] Quester C. Solutions : les français maîtrisent le terrain. DSI, 2004, n 10. [RAVAT et TESTE et ZURFLUH, 2001] Ravat F., Teste O., Zurfluh G., Modélisation multidimensionnelle des systèmes décisionnels, In Actes des 1ères Journées Francophones d Extraction et de Gestion des Connaissances - EGC 2001, Janvier 2001, Nantes (Loire-Atlantique, France). [REBAT, 2005] Rebat Marie-Thérèse. Les professionnels de la documentation au service de l enseignement supérieur et de la recherche. [En ligne] =0 (Page consultée le 16 novembre 2005). [RECHERCHE] Sous-direction des Technologies Educatives, des Technologies de l Information et de la Communication. [En ligne] (Page consultée le 24 février 2003). 403

406 Bibliographie [REVELLI, 1998] Revelli C. L intelligence stratégique sur Internet. Comment développer efficacement des activités de veille et de recherche sur les réseaux, Dunod, [REVELLI, 2000] Revelli C. Intelligence stratégique sur Internet : comment développer des activités de veille et d intelligence économique sur le web, [ROCHFELD et MOREJON, 1989] Rochfeld A., Morejon J. La Méthode Merise, Tome 3, Gamme opératoire, Editions d Organisation, [ROLE, 2004] Role F. Modélisation et manipulation de documents XML, [ROLLAND et FOUCAUT, 1978] Rolland C., Foucaut O. Concepts for design of an information system cnceptual schema an dits utilization in the REMORA project, Proceedings, 4th International Conference on VLDB, Berlin, [ROLLAND et FOUCAUT, 1987] Rolland C., Foucaut O., Benci G. Conception des Systèmes d Information, la méthode Remora, Eyrolles, [ROMAGNI et WILD, 1998] Romagni P., Wild V. L intelligence économique au service de l entreprise, Presse du Management, [ROUACH, 1996] Rouach D. La veille technologique et l intelligence économique, [RUMBAUGH, 1995] Masson, Rumbaugh, J. Modélisation et conception orientée objet, [SABLIER, 1997] Sablier A. Le renseignement stratégique d entreprise, Ed. l Harmattan, [SADOK et BANABDALLAH et LESCA, 2003] Sadok M., Benabdallah S., Lesca H. Apports Différentiels de l Internet pour la Veille Anticipative : Application au cas de Réponse aux Atteintes à la Sécurité des Réseaux d Entreprise [SALAUN, 2003] Salaün, Olivier. Introduction aux architectures web de Single Sign-on. Comité Réseau des Universités. Campus de Beaulieu - Rennes. 15 Octobre [SALLES, 2000a] Salles M. Conception et mise en oeuvre de systèmes d intelligence économique. Revue d intelligence économique, 2000, n

407 Bibliographie [SALLES, 2000b] Salles M. Quels dispositifs d IE pour les organisations? Revue d intelligence économique, 2000, n 6-7. [SALMON et DE LINARES, 1997] Salmon R., De Linares Y. L intelligence compétitive. Une combinaison subtile pour gagner ensemble. Economica, [SAMIER et SANDOVAL, 1998] Samier H., Sandoval V. La recherche intelligente sur l Internet. Outils et méthodes, Hermès, [SANS, 2003] Sans C., Drouin Ph. AMUE, Etude Système d Information. Gestion financière et comptable : Étude de cadrage des scénarios, Cap Gemini Ernst & Young Paris, le 23 mai [SCD, 2005] Réinformatisation du SCD de l Université de Valenciennes. [En ligne] =0 (Page consultée le 16 novembre 2005). [SCHEMA, 2004] Schéma directeur des espaces numériques de travail, Ministère de la jeunesse, de l éducation nationale, et de la recherche, 2004, [SIMIER et THIERY et DAVID, 2002] Simier P., Thiéry O., David A. L Intelligence Economique et l utilisateur-acteur au centre du processus de management. Congrés AIM, [SITE] Site du programme d action gouvernemental pour la société de l information. [En ligne] (Page consultée le 24 février 2003). [SITEb] Site de la Mission Technologies de l Information et de la Communication. [En ligne] (Page consultée le 24 février 2003). [SWEENEY, 2005] Sweeney R. Creating WOW! Services for millenials. [En ligne] (Page consultée le 12 avril 2005). [TARDIEU et GUTHMANN, 1991] Tardieu H., Guthmann B. Le Triangle stratégique. Les Editions d Organisation,

408 Bibliographie [TAVAILLOT, 2004] Tavaillot P.-A. Comment l IE redéfinit la fonction de DSI. DSI novembre, 2004, n 10. [TESTE, 2000] Teste O. Modélisation et manipulation d entrepôts de données complexes et historisées. Thèse. Université Paul Sabatier de Toulouse [En ligne] (Page consultée le 10 septembre 2004). [THEODORATOS et SELLIS, 1997] configuration, Proc. VLDB 97. Theodoratos D., Sellis T. Data warehouse [THIERRY, 2004] Thierry Etienne. Un site, ça crée des liens. SVM, 2004, n 230, p.160. [THIERY, 1976] Thiéry, O.Aide à la conception dans le projet REMORA, Thèse de 3 e cycle, Université Nancy 1, [THIERY et DAVID, 2002] Thiéry O., David A. Modélisation de l utilisateur : systèmes d informations stratégiques et intelligence économique. Revue association pour le développement du logiciel (ADELI), [THIERY et DUCREAU et BOUAKA et al, 2004] Thiéry O., Ducreau A., Bouaka N., David A. Piloter une organisation : de l information stratégique à la modélisation de l utilisateur ; application au domaine de la GRH, GREFIGE [THIERY et MICHEL, 1999] Thiéry O., Michel P. Une expérience object dans le monde de la gestion électronique de documents multimédia. Rapport de recherche, 1999, Juin, 28 p. [THIERY et MICHEL, 1999] Thiéry O., Michel P. Application des technologies objets à la gestion de la documentation d une entreprise. Les systèmes d information élaborée. Congrès Ile Rousse, [THIERY, 1985] Thiéry O. LASSIF, langage de spécification des systèmes d information, Logiciel d aide à la spécification des systèmes d information. Thèse de doctorat d état en sciences mathématiques, Université Nancy 1, [THIERY, 1998] Thiéry O. Management stratégique de l information dans les organisations. Les techniques et les outils sont là! Actes des 25 ans de la Mi@ge de Nancy, Nancy,

409 Bibliographie [THIERYa] [THIERYb] Nancy. Thiéry O. Support de cours SIS IUP Miage de Nancy. Thiéry O. Support de cours recherches avancées en SIS DESS ACSI et SID de [THIVANT et BOUZIDI, 2005] Thivant E. et Bouzidi L. Les pratiques d accès à l information : le cas des concepteurs de produits de placements financiers. Revue électronique suisse de science de l information, 2005, n 2, p [TREMEGE et CLERC, 1997] Trémège G., Clerc P., et al. Livre blanc des chambres de commerce et d industrie. Intelligence économique, un engagement stratégique, [UNIGE] Université de Genève. Archives Jean Piaget. [En ligne] (Page consultée le 10 septembre 2004) [VACHER, 1997] Vacher B. La gestion de l information en entreprises. Enquête sur l oubli, l étourderie, la ruse et le bricolage organisés, ADBS éditions, [VARANDAT, 2004a] Varandat M. Bases de données : XML a le champ libre. 01 informatique, [VARANDAT, 2004b] Varandat M. Le décisionnel, un simple outil de promotion pour office et sql? 01 informatique, 2004, n 1780, p.16. [VILLAIN, 1990] Villain J. L entreprise aux aguets. Information-surveillance de l environnement, propriété et protection industrielles, espionnage et contre espionnage au service de la compétitivité, Masson, [WILENSKY, 1967] Wilensky H. Organizational Intelligence : Knowledge and Policy in Government and Industry. New York, Basic Book, [YANG ET WIDOM, 2000] Yang J., Widom J. Temporal View Self-Maintenance in a Warehousing Environment, In Proceedings of the 7 th International Conference on Extending Database Technology - EDBT 2000, Konstanz (Germany). [ZHUGE et WIENER et GARCIA-MOLINA, 1997] Zhuge Y., Wiener J. L., Garcia- Molina H. Multiple View Consistency for Data Warehousing, In Proceedings of the International Conference on Data Engineering, Binghamton (UK), April

Montrer encore