THESE. En vue de l obtention du DOCTORAT DE L UNIVERSITE DE TOULOUSE. Délivré par l UNIVERSITE DE TOULOUSE III Paul SABATIER. Par.

Dimension: px
Commencer à balayer dès la page:

Download "THESE. En vue de l obtention du DOCTORAT DE L UNIVERSITE DE TOULOUSE. Délivré par l UNIVERSITE DE TOULOUSE III Paul SABATIER. Par."

Transcription

1 THESE En vue de l obtention du DOCTORAT DE L UNIVERSITE DE TOULOUSE Délivré par l UNIVERSITE DE TOULOUSE III Paul SABATIER Spécialité : INFORMATIQUE Par Mohamed Mbarki GESTION DE L HETEROGENEITE DOCUMENTAIRE : LE CAS D UN ENTREPOT DE DOCUMENTS MULTIMEDIA Soutenue le 8 février 2008, devant le jury composé de : Mr Mohand Boughanem Professeur à l Université Toulouse III Examinateur Mr Faïez Gargouri Maître de Conférences HDR à l'isim de Sfax Examinateur Mr Jean-Marie Pinon Professeur à l INSA de Lyon Rapporteur Mr Ioan Roxin Professeur à l'université de Franche-Comté Rapporteur Mme Chantal Soulé-Dupuy Professeur à l Université Toulouse I Directrice de thèse Mme Nathalie Vallès-Parlangeau Maître de Conférences à l Université Toulouse I Co-encadrante INSTITUT DE RECHERCHE EN INFORMATIQUE DE TOULOUSE Centre National de la Recherche Scientifique (UMR5505) - Institut National Polytechnique - Université Paul Sabatier - Université Toulouse I Université Paul Sabatier, 118 route de Narbonne, Toulouse cedex 04, Tel

2

3 THESE En vue de l obtention du DOCTORAT DE L UNIVERSITE DE TOULOUSE Délivré par l UNIVERSITE DE TOULOUSE III Paul SABATIER Spécialité : INFORMATIQUE Par Mohamed Mbarki GESTION DE L HETEROGENEITE DOCUMENTAIRE : LE CAS D UN ENTREPOT DE DOCUMENTS MULTIMEDIA Soutenue le 8 février 2008, devant le jury composé de : Mr Mohand Boughanem Professeur à l Université Toulouse III Examinateur Mr Faïez Gargouri Maître de Conférences HDR à l'isim de Sfax Examinateur Mr Jean-Marie Pinon Professeur à l INSA de Lyon Rapporteur Mr Ioan Roxin Professeur à l'université de Franche-Comté Rapporteur Mme Chantal Soulé-Dupuy Professeur à l Université Toulouse I Directrice de thèse Mme Nathalie Vallès-Parlangeau Maître de Conférences à l Université Toulouse I Co-encadrante INSTITUT DE RECHERCHE EN INFORMATIQUE DE TOULOUSE Centre National de la Recherche Scientifique (UMR5505) - Institut National Polytechnique - Université Paul Sabatier - Université Toulouse I Université Paul Sabatier, 118 route de Narbonne, Toulouse cedex 04, Tel

4

5 Résumé : La société de la connaissance est basée sur trois axes : la diffusion et l usage de l information via les nouvelles technologies, la déduction des connaissances induites par cette information et les impacts économiques qui peuvent en découler. Proposer aux acteurs et plus particulièrement aux "décideurs" de cette société des outils qui leur permettent d élaborer de la "connaissance" ou du moins des "éléments de connaissance" à partir de l information disponible semblent être assez difficile à assurer. Cette difficulté est due au dynamisme de l environnement et la diversité des facteurs influençant la production, l extraction et la communication des informations. En effet, ces informations sont englobées dans des documents qui sont collectés à partir des sources disséminées (Internet, Workflow, bibliothèques numériques, etc.). Ces documents sont ainsi hétérogènes sur le fond et sur la forme (ils peuvent concerner des domaines divers, sont plus ou moins structurés, peuvent être liés à des structures diverses, contiennent plusieurs type de média, sont stockés dans plusieurs type de supports, etc.). Les défis actuels sont de concevoir de nouvelles applications pour exploiter cette grande masse de documents très hétérogènes. Les travaux présentés dans cette thèse, visent à faire face à ces défis et notamment à proposer des solutions permettant de "gérer et créer de la connaissance" à partir de l intégration de toute l information disponible sur les documents hétérogènes. La manipulation des entrepôts de documents multimédia constitue le cadre applicatif de nos propositions. Notre approche s articuler autour de trois axes complémentaires : (1) la représentation, (2) le stockage (ou l intégration) et (3) l exploitation des documents hétérogènes. La représentation des documents concerne la détermination des informations à conserver et la façon selon laquelle elles doivent être organisées pour mieux appréhender et prévoir leurs usages. La solution que nous avons choisie pour répondre à ces besoins se base sur la proposition d un modèle qui intègre plusieurs niveaux de description imbriqués et complémentaires (une couche générique et une couche spécifique, une description logique et une description sémantique). Afin de gérer des documents hétérogènes, il faut pouvoir les stocker dans l entrepôt selon le modèle proposé. Nous élaborons ainsi un processus d intégration qui permet de définir des méthodes d extraction de structures des documents à intégrer, de vérifier l existence de structures identiques ou de structures approchantes dans l'entrepôt (comparaison de structures et classification automatique), d offrir la possibilité de définir des règles de transformation des structures (classification dirigée), de proposer librement la composition de nouvelles structures et d insérer les contenus de documents. Pour assurer l exploitation des documents intégrés, nous proposons des outils permettant de manipuler aussi bien la structure que le contenu (accès sémantique) par le biais de deux techniques complémentaires : (1) la recherche d information documentaire qui permet de trouver des granules documentaires ou des documents entiers selon des critères de recherches bien spécifiques. (2) L analyse multidimensionnelle qui consiste à visualiser les informations documentaires de l entrepôt selon plusieurs dimensions. La validation de nos propositions se base sur la réalisation d un outil de gestion d'entrepôt de documents multimédia intitulé MDOCREP (Multimedia DOCument REPository). Ce prototype permet de gérer des entrepôts de documents multimédia en assurant notamment l intégration, la classification, l interrogation et la visualisation multidimensionnelles des documents. La fiabilité du notre approche et la performance de ce prototype ont été validées à travers l utilisation d un corpus formé par des documents hétérogènes extraits de sources diverses et qui ne sont pas associés à un domaine particulier. Mot clés : Hétérogénéité documentaire, entrepôt, modélisation, extraction de structure, classification, comparaison de structures, adaptation de structures, intégration de structure, intégration de contenu, exploitation, recherche documentaire, analyse multidimensionnelle.

6

7 A mon père Paix à son âme

8

9 REMERCIEMENTS Je tiens à remercier très sincèrement Messieurs Claude Chrisment et Gilles Zurfluh, responsables de l équipe «Systèmes d Informations Généralisées (SIG)», pour m avoir accueilli au sein de leur équipe afin de mener à bien cette étude. Je présente ma reconnaissance envers Madame Chantal Soulé-Dupuy professeur à l'université Toulouse I qui a accepté sans réserve de diriger cette thèse. Elle s y est grandement impliquée par ses directives, ses remarques et suggestions. Je tiens à la remercier aussi pour la liberté qu elle m'a laissée dans la conduite de ma recherche. J'ai admiré ses qualités scientifiques, pédagogiques, mais surtout humaines. Merci d avoir guidé mes premiers pas dans le chemin de la recherche. Mes remerciements vont également à Madame Natalie Vallès-Parlangeau, maître de conférences à l'université Toulouse I pour avoir encadré et suivi cette étude, pour ses conseils judicieux, ses lectures minutieuses et aussi pour ses encouragements dans les moments clés de son élaboration. J'ai puisé un grand nombre d'idées dans mes conversations avec elle. Ses remarques pertinentes m ont amené à reconsidérer ma position et réviser bien des points. Mes remerciements les plus respectueux vont à Messieurs Jean-Marie Pinon, professeur à l INSA de Lyon et Ioan Roxin, professeur à l Université de Franche-Comté qui m ont fait l honneur d évaluer cette thèse et d en être rapporteurs. Je les remercie pour leurs conseils et leurs suggestions qui ont permis l amélioration de ce manuscrit. Mes remerciements vont également à Messieurs Faïez Gargouri, maître de conférences HDR et directeur de l ISIM de Sfax et Mohand Boughanem, professeur à l Université Paul Sabatier pour avoir accepté d examiner mes travaux de recherche. Je les remercie pour l honneur qu ils me font en participant à mon jury. Les encouragements de mes amis, de mes collègues Baccar, Karim, Yessin, Houssem, Moultazem, les Anis (Oubada, Gaddour et Jedidi), Faiza, Samiha, Lotfi, Manel, Fredj, Wissem, Wassim, Kaïs, Hamid, Lobna, Bouchra, Estella, Desiré, Dana, Ronan, Guillaume et bien d autres encore, étaient la bouffée d oxygène qui me ressourçait dans les moments pénibles, de solitude et de souffrance, où l on a terriblement besoin d un petit mot, d un petit geste, aussi humble soit-il, de soutien moral. Mes collègues Karim et Wassim sont cordialement remerciés pour m avoir détaché des mes charges pédagogiques durant deux mois. Merci à Karim qui était toujours un bon collègue et ami dans le bureau, dans les réunions de travail et en dehors de l'irit. Je voudrais rendre hommage à mes professeurs qui ont contribué à ma formation de loin ou de près, en France ou en Tunisie. Merci à mon père qui m a beaucoup appris, qui m a toujours encouragé et rêvé de me voir docteur et que dieu a voulu qu'il nous laisse juste quelques mois avant ma soutenance. Que son âme repose en paix. Merci à mon adorable mère, à celle qui a toujours été présente et continue de l être pour faire mon bonheur. Merci pour t être sacrifiée pour que tes enfants grandissent et prospèrent. Merci aussi à mes sœurs chéries Asma, Amel et Ikram d être toujours à mes côtés et qui par leurs présence et leurs amour ont donné du goût et un sens à notre vie de famille. Je ne manquerai pas de dire un grand merci à mon beau-frère Hammadi et à mon très cher ami Baccar (mon frérot). Qu'ils trouvent avec ceci un modeste geste de reconnaissance et de remerciement. Enfin, je tiens à remercier ma future femme (inchallah) Feryel pour son soutien constant et sa présence malgré la distance merci pour ton courage, ton appui sans limite, ta persévérance et ta compréhension. J espère du fond du cœur que tout mon petit monde à moi, trouve ici un mot de reconnaissance.

10

11 Sommaire Introduction Générale 1 PREMIERE PARTIE - DOCUMENTS MULTIMEDIA : PRESENTATION ET ETAT DE L ART SUR LES APPROCHES DE GESTION Chapitre I - Documents multimédia : concepts de base I.1. Introduction...13 I.2. Document : du textuel vers le multimédia I.2.1. Définition et évolution du concept de "document"...13 I.2.2. Document multimédia : définition et composition...14 I.3. Les structures documentaires I.3.1. Typologie des structures documentaires...16 I.3.2. Bilan sur la typologie des structures documentaires...20 I.3.3. Les différentes représentations de structures...20 I.3.4. Bilan sur les représentations de structures...23 I.3.5. Les enjeux de la structuration...23 I.4. Les standards documentaires...27 I.4.1. Les standards de structuration...27 I.4.2. Bilan sur les standards de structuration...35 I.4.3. Les standards de description...37 I.4.4. Bilan sur les standards de description...43 I.5. Conclusion sur les concepts de base...43 Chapitre II - Gestion des documents multimédia : Etat de l art II.1. Introduction...49 II.2. Indexation de documents multimédia...50 II.2.1. Exemples de descripteurs...50 II.2.2. Bilan sur les descripteurs...52 II.2.3. Exemples de projets d indexation...53 II.2.4. Bilan sur les projets...56 i

12 Sommaire II.3. Modélisation de documents multimédia...56 II.3.1. Exemples de modélisation de documents multimédia...57 II.3.2. Bilan sur la modélisation des documents multimédia...62 II.4. Construction d espaces de stockage et intégration de documents...63 II.4.1. Les étapes de construction d un espace de stockage...63 II.4.2. Les types d intégration...65 II.4.3. La comparaison de structures...65 II.4.4. Bilan sur la comparaison de structures...68 II.5. Interrogation de documents...69 II.5.1. Les langages de requêtes spécifiques...71 II.5.2. Les langages de requêtes issus de SQL...73 II.5.3. Bilan sur les langages de requêtes...77 II.6. Conclusion...78 DEUXIEME PARTIE - GESTION DE L HETEROGENEITE DOCUMENTAIRE : PROPOSITION D UN MODELE GENERIQUE ET APPLICATION AU CAS DES ENTREPOTS DE DOCUMENTS Chapitre III - Un modèle générique de représentation de documents multimédia III.1. Introduction...87 III.2. Modélisation des documents multimédia...88 III.2.1. Gestion de l hétérogénéité intra document...88 III.2.2. Gestion de l hétérogénéité inter documents...95 III.2.3. Notre modèle de représentation des documents multimédia III.3. Démarche de classification des documents III.3.1. Extraction de structures spécifiques III.3.2. Comparaison de structures III.3.3. Adaptation des structures III.4. Conclusion Chapitre IV Validation - Proposition d un outil de gestion d entrepôts de documents multimédia IV.1. Introduction IV.2. Cadre applicatif IV.2.1. Entrepôt de documents : définitions et objectifs IV.2.2. Architecture de MDOCREP : un outil de gestion d entrepôts de documents multimédia ii

13 Sommaire IV.3. Intégration de documents IV.3.1. Exemples de mise en œuvre du processus d'intégration IV.3.2. Expérimentations et discussion sur la classification IV.4. Exploitation de l'entrepôt IV.4.1. Recherche d information documentaire IV.4.2. Analyse multidimensionnelle IV.5. Conclusion Conclusion Générale Liste des publications Bibliographie..195 Annexes 205 Table des figures 243 Table des tableaux. 247 Glossaire Lexique des concepts et formalismes iii

14 Sommaire iv

15 Introduction générale 1

16 Introduction générale 2

17 Introduction générale 1. Contexte et problématique Le document électronique représente aujourd hui un vecteur et un support d information que les organisations doivent apprendre à ne plus négliger si elles veulent être sûres d identifier et de gérer toutes les données qui leur sont utiles au quotidien. En effet, il est entendu aujourd hui que plus de la moitié des données nécessaires au fonctionnement d une organisation sont encapsulées dans des documents, et non uniquement présentes dans les bases de données opérationnelles. En conséquence, ces organisations sont confrontées à la gestion d un volume croissant de données provenant de sources disséminées, d applications différentes et ayant des structures souvent hétérogènes. Une gestion optimisée de ces données, et en particulier des documents qui les encapsulent, est essentielle. Les organisations ne peuvent réaliser pleinement la valeur ajoutée que représentent ces informations (données, documents, etc.), à moins qu elles ne puissent les intégrer efficacement à différents systèmes et les échanger d un système à un autre, pour les exploiter et les acheminer vers la bonne personne et de la meilleure façon. Or leur intégration demeure encore aujourd hui une des difficultés majeures, en amont même de tout processus d analyse et d exploitation. Pour gérer efficacement ces documents et données, il est indispensable d avoir une vue d ensemble du processus, en considérant tous les aspects, de la modélisation à l exploitation en passant par le stockage, sans perdre de vue l aspect hétérogénéité. L'hétérogénéité de ces documents se trouve à deux niveaux : - sur le fond, les documents peuvent concerner des domaines très divers. L utilisateur doit fouiller et parcourir les documents pour trouver l information utile ; - sur la forme, les documents peuvent être plus ou moins structurés, de formats standards ou non, et de structures différentes. L utilisateur doit ainsi disposer d outils adéquats pour visualiser et/ou exploiter l information. Les défis que nous nous proposons de relever dans cette thèse concernent la conception de nouvelles approches pour gérer ces grandes masses de documents hétérogènes, en faciliter l accès et la manipulation. 2. Propositions et contributions Nos contributions se situent dans le cadre de la modélisation et de l intégration de documents hétérogènes dans le but d en faciliter l exploitation. Nous cherchons notamment à spécifier de nouvelles méthodes et de nouveaux outils pour la modélisation, le stockag et l'exploitation des fragments d information contenus dans ces documents. En amont du stockage de documents, des recherches sur les informations à conserver, et sur la façon selon laquelle elles doivent être organisées, sont nécessaires afin de mieux appréhender et prévoir leurs usages. L approche que nous avons choisie pour répondre à ces besoins se base sur la proposition d un modèle qui permette de : - décrire n'importe quel type de données (structurées, semi-structurées et non structurées) ; - supporter n importe quel type de média (texte, image, son, vidéo) ; 3

18 Introduction générale - supporter plusieurs structures et tout type de fragmentation de documents ; - représenter et décrire les fragments ou granules de documents qui composent les documents ; - décrire le contenu des documents par des ensembles non-prédéfinis de métadonnées ; - classer les documents ayant des structures similaires ou approchantes (par exemple, classe des curriculum vitae, classe des flashs d informations, classe des réponses à des appels d offres, etc.). L instanciation de ce modèle, pour la constitution d un espace de stockage via un système de gestion de documents hétérogènes, doit alors garantir la classification de ces documents tout en préservant leurs spécificités (structurelles notamment). La démarche de classification que nous proposons intègre des méthodes de fragmentation et d extraction de structures de documents, ainsi que des algorithmes de comparaison de structures de documents. Il s agit en particulier de comparer la structure du document à intégrer avec les structures qui existent déjà dans l'espace de stockage. Cette comparaison permet de vérifier l existence de structures identiques ou approchantes, d étudier les adaptations à réaliser sur des structures ou de conclure à la création de nouvelles structures. Par la suite, l exploitation des documents et des granules de documents peut reposer aussi bien sur la structure que sur le contenu (accès sémantique) des documents modélisés. Les spécificités du modèle proposé élargissent ainsi les possibilités d exploitation des documents par le biais de deux processus complémentaires : (1) un processus de recherche d information documentaire impliquant la structure des documents et/ou le contenu des granules de documents. Ce processus permet de rechercher et restituer des passages de documents en réponse à une requête utilisateur composée généralement de mots-clés décrivant la structure des documents et/ou le contenu des granules. Ce processus permet ainsi de restituer des granules documentaires ou des documents entiers (selon le niveau de précision souhaité par l utilisateur) qui vérifient des critères de recherches bien spécifiques ; (2) un processus d analyse multidimensionnelle. Ce processus consiste à permettre d analyser les informations modélisées et stockées selon des dimensions non prédéfinies. L objectif est d agréger et de visualiser d une manière graphique et synthétique le contenu d une grande masse documentaire en présentant le sujet d analyse selon plusieurs axes. Le choix des paramètres, sujets et axes d analyses, doit être souple et dynamique. Dans le cadre de cette thèse, nous présentons une application des approches de modélisation, de classification et d exploitation proposées via la mise en œuvre d un outil de gestion de documents multimédia hétérogènes. Cet outil appelé MDOCREP, pour Multimedia DOCument REPository, repose sur la conception d un entrepôt de documents visant à structurer l ensemble des informations contenues dans des collections de documents, à les consolider et à permettre leur exploitation. Au travers de cet outil nous avons pu valider l ensemble de nos propositions dans la mesure où il permet d instancier le modèle proposé et d assurer la gestion d entrepôts de documents multimédia en intégrant les démarches de classification et d exploitation du contenu de l'entrepôt. La fiabilité du notre approche et les performances de ce prototype ont été 4

19 Introduction générale démontrées à travers l utilisation d un corpus composé de documents extraits de sources diverses associés à plusieurs domaines. Il s agit de documents, éventuellement annotés, fournis dans le cadre de benchmarks ou de projets portant sur des contenus hétérogènes : émissions radio, sites web et autres. 3. Organisation du mémoire Comme le résume la figure suivante, ce mémoire est décomposé en deux grandes parties chacune comprenant deux chapitres. La première partie introduit et décrit tout le contexte de nos travaux et constitue un état de l art des domaines abordés dans le cadre de notre thèse. La seconde partie présente nos principales contributions et décrit le cadre de leur validation. Le premier chapitre traite l'évolution de concept document, du texte vers le multimédia, et aborde ensuite la description des documents multimédia. Nous présentons également dans ce chapitre un panorama des typologies et des méthodes de représentation des structures de documents sur lesquelles repose la description de l'organisation et du contenu des documents. Nous introduisons à ce niveau les concepts de semistructuralité et de multistructuralité. La dernière section de ce chapitre est consacrée à un tour d'horizon des standards documentaires qui permettent de gérer la représentation et la description des documents. Le deuxième chapitre présente un état de l'art des travaux qui ont été réalisés dans le cadre de la modélisation, du stockage et de l'exploitation de documents multimédia hétérogènes. Dans une première section, nous passons en revue quelques exemples de descripteurs et de projets d'indexation classés par type de medium traité. Une deuxième section dresse un panorama des modèles de représentation de documents multimédia. Ces travaux de modélisation reposent sur les principes d indexation introduits précédemment. Une troisième section introduit et définit les principes généraux d un processus d'intégration de documents dans un espace de stockage. Sont 5

20 Introduction générale plus particulièrement abordées ici quelques approches de comparaison de structures. Dans la dernière section de ce chapitre, nous décrivons quelques langages d interrogation de documents. Le troisième chapitre est dédié à la présentation de nos travaux concernant la modélisation de documents multimédia et visant à gérer l'hétérogénéité documentaire. Pour gérer l hétérogénéité intra-document, nous proposons d utiliser une dichotomie entre structures et contenus des documents. Il s agit de traduire séparément l organisation structurelle des fragments de documents multimédia et la sémantique du contenu de chacun d eux. Pour gérer l hétérogénéité inter documents, nous proposons une démarche de classification basée sur une comparaison et le calcul d un degré de ressemblance entre structures de documents afin de créer des structures génériques qui traduisent des organisations communes à des ensembles de structures similaires. Le modèle générique proposé, ainsi que la démarche de classification étudiée sont décrits dans ce chapitre. Le quatrième chapitre présente le cadre applicatif qui a été choisi, les développements réalisés ainsi que les validations effectuées. Dans un premier temps, nous définissons le concept d entrepôt de documents qui constitue le cadre applicatif et nous détaillons les objectifs associés. Nous présentons ensuite l architecture de l outil de gestion de documents multimédia MDOCREP (Multimedia DOCument REPository) qui a été développé. Nous focalisons ensuite ce chapitre sur les deux modules qui nous ont permis de valider les propositions décrites dans le chapitre précédent. Le premier met en œuvre la démarche de classification et de stockage dans l entrepôt de documents multimédia hétérogènes. Le deuxième module permet l exploitation du contenu de l entrepôt par le biais de deux processus complémentaires : recherche d information documentaire et analyse multidimensionnelle. Nous décrivons notamment les résultats des expérimentations réalisées avec MDOCREP. Nous concluons ce mémoire en rappelant nos contributions, les apports et l originalité de notre travail, en précisant ses limites et les perspectives de recherche envisageables. 6

21 PREMIERE PARTIE : DOCUMENTS MULTIMEDIA : PRESENTATION ET ETAT DE L ART SUR LES APPROCHES DE GESTION 7

22 8

23 Chapitre I DOCUMENTS MULTIMEDIA : CONCEPTS DE BASE 9

24 10

25 Chapitre I : Documents multimédia : Concepts de base I.1. Introduction I.2. Document : du textuel vers le multimédia I.2.1. Définition et évolution du concept de "document"...13 I.2.2. Document multimédia : définition et composition...14 I.3. Les structures documentaires I.3.1. Typologie des structures documentaires...16 I Structure logique...16 I Structure physique...17 I Structure spatiale...18 I Structure temporelle...18 I Structure sémantique...19 I Autres types de structures...20 I.3.2. Bilan sur la typologie des structures documentaires...20 I.3.3. Les différentes représentations de structures...20 I Représentation sous forme de liste...21 I Représentation sous forme d arbre...22 I Représentation sous forme de forêt...22 I Représentation sous forme de graphe...23 I.3.4. Bilan sur les représentations de structures...23 I.3.5. Les enjeux de la structuration...23 I Les données semi-structurées...24 I Les documents multi-structurés...24 I.4. Les standards documentaires...27 I.4.1. Les standards de structuration...27 I SGML et HYTIME...27 I HTML...30 I XML et ses langages complémentaires...31 I XHTML...33 I SMIL...34 I.4.2. Bilan sur les standards de structuration...35 I.4.3. Les standards de description...37 I IPTC...37 I Dublin Core (DC)...38 I RDF...39 I XMP...40 I MPEG I.4.4. Bilan sur les standards de description...43 I.5. Conclusion sur les concepts de base

26 Chapitre I : Documents multimédia : Concepts de base 12

27 Chapitre I : Documents multimédia : Concepts de base I.1. Introduction Le concept de document a connu des mutations profondes : d une part, les contenus textuels ont été enrichis par d autres types de média (image, son, audiovisuel, etc.) et d autre part, le développement rapide des technologies numériques a modifié considérablement les conditions de stockage et de consultation de ces documents. Au croisement de ces mutations émerge la problématique de la gestion des documents numériques multimédia. Nous commençons ce chapitre par suivre ces deux mutations dans le temps à travers l évolution du concept de document. Nous présentons ensuite les composants de base d un document multimédia. Cette présentation nous renvoie à de nombreux enjeux concernant la gestion de l aspect hétérogène des documents multimédia. Pour assurer cette gestion et afin de décrire les documents multimédia et les différentes relations qui décrivent leur composition, plusieurs types de structures (logique, physique, temporelle, etc.) peuvent être utilisés. Nous consacrons la troisième section à un tour d horizon de ces types de structures et leurs représentations (liste, arbre, graphe, etc.). L étude de la typologie structurelle nous a amené à évoquer des problèmes concernant deux aspects : celui de multi-structuralité et celui de semistructuralité. Les résolutions de tels problèmes se basent sur l utilisation des standards documentaires qui permettent de gérer d une manière uniforme : (1) la présentation des structures globales de document ; (2) la description des contenus en utilisant notamment des métadonnées. Ces standards contribuent à la mise en place d une gestion flexible des structures des documents : les documents normalisés sont plus largement diffusables et exploitables (réutilisation, adaptation, collaboration, etc.). Un panorama des standards les plus utilisés sera présenté dans la dernière section de ce chapitre. Nous commençons cette dernière section par présenter les standards de structuration. Nous la clôturons par la définition de métadonnées ainsi que les différentes standards de description qui gèrent l organisation de ces métadonnées afin d assurer une présentation détaillée et précise de contenus des documents multimédia. I.2. Document : du textuel vers le multimédia La numérisation a permis la dématérialisation de documents : le conteneur de documents est passé du papier aux supports magnétique et électronique. En même temps, le document, classiquement textuel, a pu s enrichir d éléments issus d autres média. Dans cette section, nous présentons l évolution du concept de "document". Nous présentons également les média de base qui peuvent être englobés dans un document multimédia. I.2.1. Définition et évolution du concept de "document" Une définition générique du concept de "document" est donnée par le Larousse : «tout renseignement écrit ou objet servant de preuve ou d information». 13

28 Chapitre I : Documents multimédia : Concepts de base Cette définition met en avant deux points : L aspect informationnel et l aspect matériel du document. L aspect matériel concerne le support de l information, donc son stockage. Un des aspects important est aussi l échange. Cet aspect est abordé dans la définition de [Blasselle B., 1997], qui mentionne qu un document permet d assurer la «transmission de connaissance, de savoir et d information». Cette capacité de transmission est assurée par la présentation de l information sous une forme persistante et portative du contenu, qui est classiquement le support papier. Grâce à la numérisation, les formes de stockage ont connu des évolutions en passant du format papier classique au format électronique. Ce format offre des capacités de sauvegarde et des possibilités d échanges nettement plus importantes. Il a conféré au document de nouvelles capacités aussi bien au niveau du contenu informationnel qu au niveau des traitements possibles. Dans un tel document, l information véhiculée intègre du texte, des images fixes ou animées, des graphiques, du son, de la vidéo, etc. En outre, un document électronique ne se contente plus de remplir les fonctionnalités d un simple document papier, il permet d offrir d autres possibilités de gestion tels que : une restitution selon différents formats, une communication avec d autres systèmes informatiques (échanges, partage, etc.), des recherches d informations, etc. [Dupoirier G., 1995]. La numérisation des documents a ainsi amené à des nouvelles définitions du terme document comme celle donnée par l'iso (International Organization for Standardization) : «Un document est l ensemble d un support d information et des données enregistrées sur celui-ci sous forme en général permanente et lisible par l homme et la machine». Contrairement au document matériel traditionnel, l'accès à l'information sur les supports numériques n'est jamais direct. «Il passe au minimum par le décodage d'une représentation sous forme binaire de l'information pour en proposer une présentation sous une forme sémiotique lisible» [Bachimont B. et Crozat S., 2004]. Le document numérique peut être considéré ainsi comme une reconstruction dynamique d un document matériel. Le remplacement des formes matérielles (le support papier) par des formes immatérielles (électroniques ou numériques) présente plusieurs avantages : gains de temps et d'espace, amélioration de la réactivité, réduction des coûts de stockage et d échange, etc. Rapidement sont venus s'ajouter aux documents issus de la numérisation, des documents directement créés sous forme numérique (éditions informatiques ou bureautiques, messages électroniques, etc.). Le document est donc devenu de plus en plus riche et complexe en intégrant des contenus multimédia (texte, vidéo, image, graphique, son, etc.). Ces contenus sont regroupés dans ce que l on appelle désormais des documents multimédia. I.2.2. Document multimédia : définition et composition Le terme "multimédia" se rapporte à une communication à travers plusieurs types de média utilisés conjointement. En se référant à la définition du concept de "document", nous pouvons définir un document multimédia comme étant l agencement interactif dans le temps et dans l espace d éléments distincts de natures différentes (issus de plusieurs types de média) afin d enrichir le contenu de l information diffusée. Les média peuvent être vus ainsi comme les briques fondatrices des documents multimédia. Un medium est définit comme «un type de données abstrait c est à dire une description d'une structure de données 14

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude

Plus en détail

Gestion collaborative de documents

Gestion collaborative de documents Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,

Plus en détail

LECTURE CRITIQUE. Accompagner les enseignants et formateurs dans la conception d une formation en ligne

LECTURE CRITIQUE. Accompagner les enseignants et formateurs dans la conception d une formation en ligne LECTURE CRITIQUE Accompagner les enseignants et formateurs dans la conception d une formation en ligne Christian Ernst E-learning. Conception et mise en œuvre d un enseignement en ligne Guide pratique

Plus en détail

Outils permettant la diffusion de l information. Un point sur le droit numérique

Outils permettant la diffusion de l information. Un point sur le droit numérique Technologies de l Information et de la Communication Introduction aux NTE/TICE Présentation des UNR UNT Outils permettant la diffusion de l information Conceptualisation d un module d apprentissage numérique

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

Université de Lausanne

Université de Lausanne Université de Lausanne Records management et archivage électronique : cadre normatif Page 2 Ce qui se conçoit bien s énonce clairement Nicolas Boileau Page 3 Table des matières Qu est- ce que le «records

Plus en détail

Master Information et communication spécialité Produits et services multimédia

Master Information et communication spécialité Produits et services multimédia 18/09/2013 http://www.univ-fcomte.fr Master Information et communication spécialité Produits et services multimédia UFR Sciences, techniques, et gestion de l'industrie http://stgi.univ-fcomte.fr/ Dénomination

Plus en détail

ISO/CEI 11172-3 NORME INTERNATIONALE

ISO/CEI 11172-3 NORME INTERNATIONALE NORME INTERNATIONALE ISO/CEI 11172-3 Première édition 1993-08-01 Technologies de l information - Codage de l image animée et du son associé pour les supports de stockage numérique jusqu à environ Ii5 Mbit/s

Plus en détail

GED: Gestion Electronique de Document (Support de cours) R. MAHMOUDI (mahmoudr@esiee.fr) www.research-ace.net/~mahmoudi 1 Gestion Electronique de Documents Plan du cours - Introduction générale - Spécificités

Plus en détail

Nouveau Web Client marquant, Cumulus Video Cloud, optimisations de la base de données, et plus..

Nouveau Web Client marquant, Cumulus Video Cloud, optimisations de la base de données, et plus.. INFORMATION PRODUIT : Quoi de Neuf dans Cumulus 9.0? Nouveau Web Client marquant, Cumulus Video Cloud, optimisations de la base de données, et plus.. Les nouveautés marquantes et les améliorations disponibles

Plus en détail

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme RÉPUBLIQUE ET CANTON DE GENÈVE Archives d'etat Formats de fichiers adaptés à l'archivage électronique à moyen et long terme Version Date Objet de la version 1.0 19.10.2011 Document validé par le Collège

Plus en détail

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Journée organisée par le CRFCB Midi-Pyrénées / Languedoc-Roussillon

Plus en détail

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION Mentions

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas

Plus en détail

Université de Bangui. Modélisons en UML

Université de Bangui. Modélisons en UML Université de Bangui CRM Modélisons en UML Ce cours a été possible grâce à l initiative d Apollinaire MOLAYE qui m a contacté pour vous faire bénéficier de mes connaissances en nouvelles technologies et

Plus en détail

XML pour la mise en valeur des informations

XML pour la mise en valeur des informations XML pour la mise en valeur des informations Exploitez l'intelligence des documents! DIRO - Cours IFT3225 Une présentation d Irosoft Inc. Alain Lavoie Septembre 2011 Qui suis-je? Alain Lavoie B.Sc. Mathématique-Informatique

Plus en détail

ISTEX, vers des services innovants d accès à la connaissance

ISTEX, vers des services innovants d accès à la connaissance ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions

Plus en détail

Formats d images. 1 Introduction

Formats d images. 1 Introduction Formats d images 1 Introduction Lorsque nous utilisons un ordinateur ou un smartphone l écran constitue un élément principal de l interaction avec la machine. Les images sont donc au cœur de l utilisation

Plus en détail

Méthodes d évolution de modèle produit dans les systèmes du type PLM

Méthodes d évolution de modèle produit dans les systèmes du type PLM Résumé de thèse étendu Méthodes d évolution de modèle produit dans les systèmes du type PLM Seyed Hamedreza IZADPANAH Table des matières 1. Introduction...2 2. Approche «Ingénierie Dirigée par les Modèles»

Plus en détail

I) - DEFINITIONS I-A) TERMINOLOGIE

I) - DEFINITIONS I-A) TERMINOLOGIE Venise CANABADY Lycée Amiral Bouvet St Benoît PARTIE I - DEFINITIONS PARTIE II - LES GRANDES FONCTIONNALITES DE LA GED PARTIE III - GED : INDEXATION ET OUTILS PARTIE IV- LA GESTION ÉLECTRONIQUE DES DOCUMENTS

Plus en détail

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier? DOSSIER SOLUTION CA ERwin Modeling Comment gérer la complexité des données et améliorer l agilité métier? CA ERwin Modeling fournit une vue centralisée des définitions de données clés afin de mieux comprendre

Plus en détail

Introduction aux concepts d ez Publish

Introduction aux concepts d ez Publish Introduction aux concepts d ez Publish Tutoriel rédigé par Bergfrid Skaara. Traduit de l Anglais par Benjamin Lemoine Mercredi 30 Janvier 2008 Sommaire Concepts d ez Publish... 3 Système de Gestion de

Plus en détail

Présentation générale du projet data.bnf.fr

Présentation générale du projet data.bnf.fr Présentation générale du projet data.bnf.fr La Bibliothèque nationale a mis en œuvre un nouveau projet, qui a pour but de rendre ses données plus utiles sur le web. Ceci nécessite de transformer données

Plus en détail

Compte-rendu re union Campus AAR 3 mars 2015

Compte-rendu re union Campus AAR 3 mars 2015 Compte-rendu re union Campus AAR 3 mars 2015 Table des matières Liste d actions... 2 I. Environnement d analyse : INA, Armadillo... 3 a. Connexion de l outil INA avec API Armadillo... 3 b. Outil d analyse

Plus en détail

Les ressources numériques

Les ressources numériques Les ressources numériques Les ressources numériques sont diverses et regroupent entre autres, les applications, les bases de données et les infrastructures informatiques. C est un ensemble de ressources

Plus en détail

TD : Codage des images

TD : Codage des images TD : Codage des images Les navigateurs Web (Netscape, IE, Mozilla ) prennent en charge les contenus textuels (au format HTML) ainsi que les images fixes (GIF, JPG, PNG) ou animée (GIF animée). Comment

Plus en détail

Nom de l application

Nom de l application Ministère de l Enseignement Supérieur et de la Recherche Scientifique Direction Générale des Etudes Technologiques Institut Supérieur des Etudes Technologiques de Gafsa Département Technologies de l Informatique

Plus en détail

Les utilisations pédagogiques du Tableau Numérique Interactif (TNI) dans l enseignement d Économie-Gestion :

Les utilisations pédagogiques du Tableau Numérique Interactif (TNI) dans l enseignement d Économie-Gestion : Les utilisations pédagogiques du Tableau Numérique Interactif (TNI) dans l enseignement d Économie-Gestion : Pascal ROOS Professeur d Économie Gestion Lycée Edmond Rostand, Saint Ouen l Aumône (95) Face

Plus en détail

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/ Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : cinzia.digiusto@gmail.com webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/

Plus en détail

FORMATS DE FICHIERS. Quels sont les différents types d informations numériques dans un document multimédia?

FORMATS DE FICHIERS. Quels sont les différents types d informations numériques dans un document multimédia? FORMATS DE FICHIERS Choisir et justifier un format de fichier pour réaliser un document multimédia 1 ) Le problème d Amélie Amélie et Léa ont publié leur premier article sur leur propre blog. Amélie constate

Plus en détail

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE»

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» Du cours Modélisation Semi -Formelle de Système d Information Du Professeur Jean-Pierre GIRAUDIN Décembre. 2002 1 Table de matière Partie 1...2 1.1

Plus en détail

Analyse comparative entre différents outils de BI (Business Intelligence) :

Analyse comparative entre différents outils de BI (Business Intelligence) : Analyse comparative entre différents outils de BI (Business Intelligence) : Réalisé par: NAMIR YASSINE RAGUI ACHRAF Encadré par: PR. L. LAMRINI Dans le domaine d économies des Big Data et Open Data, comment

Plus en détail

Les diagrammes de modélisation

Les diagrammes de modélisation L approche Orientée Objet et UML 1 Plan du cours Introduction au Génie Logiciel L approche Orientée Objet et Notation UML Les diagrammes de modélisation Relations entre les différents diagrammes De l analyse

Plus en détail

LES OUTILS DU TRAVAIL COLLABORATIF

LES OUTILS DU TRAVAIL COLLABORATIF LES OUTILS DU TRAVAIL COLLABORATIF Lorraine L expression «travail collaboratif» peut se définir comme «l utilisation de ressources informatiques dans le contexte d un projet réalisé par les membres d un

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

Les Architectures Orientées Services (SOA)

Les Architectures Orientées Services (SOA) Les Architectures Orientées Services (SOA) Ulrich Duvent Guillaume Ansel Université du Littoral Côte d Opale 50, Rue Ferdinand Buisson BP 699 62228 Calais Cedex Téléphone (33) 03.21.46.36.92 Télécopie

Plus en détail

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte 1Les bases : vos objectifs 2 Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Catalogue des formations Edition 2015

Catalogue des formations Edition 2015 Antidot - Formations Catalogue des formations Edition 2015 : catalogue_formation_2015 Révision du 06.01.2015 Sommaire!!"##$%&'( )! $*$+,(-'(."##'+.'&( /!,'.0+"1"2%'( /!!."3'( /! $(3&"3"!(-4(5(.$,$1"24'(-'!(6"&#$,%"+!(7('-%,%"+()89:(;(

Plus en détail

Quels fondements, services fonctionnalités et limites de l intranet?

Quels fondements, services fonctionnalités et limites de l intranet? Quels fondements, services fonctionnalités et limites de l intranet? 1 L intranet est-il incontournable? - 29 septembre 19 Tél : 01 40 08 40 86 pguillaume@atelier.fr Louis-Pierre GUILLAUME Sommaire de

Plus en détail

Systèmes d information et bases de données (niveau 1)

Systèmes d information et bases de données (niveau 1) Systèmes d information et bases de données (niveau 1) Cours N 1 Violaine Prince Plan du cours 1. Bibliographie 2. Introduction aux bases de données 3. Les modèles 1. Hiérarchique 2. Réseau 3. Relationnel

Plus en détail

nom : Collège Ste Clotilde

nom : Collège Ste Clotilde UNE CONFIGURATION INFORMATIQUE Objectif : Identifier les éléments principaux d une configuration L ordinateur enregistre des données qu il traite pour produire un résultat Sifflements 20 Notice 12 attache

Plus en détail

Quels apprentissages info-documentaires au collège?

Quels apprentissages info-documentaires au collège? Quels apprentissages info-documentaires au collège? Quel cadre? Quels apprentissages associés? 1983 : Éducation aux médias (EAM) 1986 : Initiation à la recherche documentaire (IRD) 2003 : Information-Documentation

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Université Paris XI Faculté des sciences d Orsay THÈSE. présentée pour l obtention du grade de Docteur en Sciences de l Université Paris-Sud XI Orsay

Université Paris XI Faculté des sciences d Orsay THÈSE. présentée pour l obtention du grade de Docteur en Sciences de l Université Paris-Sud XI Orsay N d ordre : 8563 Université Paris XI Faculté des sciences d Orsay THÈSE présentée pour l obtention du grade de Docteur en Sciences de l Université Paris-Sud XI Orsay Par Cédric JACQUIOT Spécialité : INFORMATIQUE

Plus en détail

Etapes de création d une revue électronique

Etapes de création d une revue électronique Economique Site web du guide des ressources pour l édition de revues numériques Coordination : Ghislaine Chartron et Jean-Michel Salaun Doctorant en sciences de l'information Cette analyse vise à donner

Plus en détail

Les outils actuels permettent-ils d automatiser la production de cartes? De quels outils dispose-t-on?

Les outils actuels permettent-ils d automatiser la production de cartes? De quels outils dispose-t-on? Le "Portrait de la Biodiversité Communale" est un document réalisé au niveau national pour chaque commune, regroupant les connaissances publiques disponibles et mobilisables à l'échelle nationale en matière

Plus en détail

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application Architecture Multi-Tier Traditionnellement une application informatique est un programme exécutable sur une machine qui représente la logique de traitement des données manipulées par l application. Ces

Plus en détail

Veille Internet avec les flux RSS, recherche et veille sur les réseaux sociaux

Veille Internet avec les flux RSS, recherche et veille sur les réseaux sociaux URFIST DE TOULOUSE Des formations dans le domaine de l information scientifique et technique et de la publication web PROGRAMME DES STAGES JANVIER-MARS 2013 15/01/2013 : Initiation à LateX 21/01/2013 :

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1 La Geo-Business Intelligence selon GALIGEO avec ESRI 2005 session «Décisionnel» 26/10/2005 1 La Business Intelligence : Une Définition La Business intelligence permet l utilisation des données opérationnelles

Plus en détail

COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL

COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL J. TICHON(1) (2), J.-M. TOULOTTE(1), G. TREHOU (1), H. DE ROP (2) 1. INTRODUCTION Notre objectif est de réaliser des systèmes de communication

Plus en détail

Conservation des documents numériques

Conservation des documents numériques Conservation des documents numériques Qu'est ce qu'un document numérique? Matthieu GIOUX matthieu.gioux@bnf.fr Contexte de la préservation des documents numériques Une croissance en expansion Développement

Plus en détail

Communiqué de Lancement

Communiqué de Lancement Direction du Marketing Produits Sage - Division Mid Market Communiqué de Lancement Rapprochement Bancaire 1000 Produit : Rapprochement Bancaire 1000 Bases de Données : Oracle - MS/SQL Server Microsoft

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3

Plus en détail

Europresse.com. Pour les bibliothèques publiques et de l enseignement. Votre meilleur outil de recherche en ligne. Guide version 1.

Europresse.com. Pour les bibliothèques publiques et de l enseignement. Votre meilleur outil de recherche en ligne. Guide version 1. Europresse.com Pour les bibliothèques publiques et de l enseignement Votre meilleur outil de recherche en ligne Guide version 1.5 CEDROM-SNi Comprendre la page d accueil 1. Bandeau de navigation 2. Espace

Plus en détail

Une approche pour l extraction automatique de structures sémantiques de documents XML

Une approche pour l extraction automatique de structures sémantiques de documents XML Une approche pour l extraction automatique de structures sémantiques de documents XML Salma Ben Mefteh*,**, Kaïs Khrouf*, Jamel Feki*, Maha Ben Kraiem*, Chantal Soulé-Dupuy** * Laboratoire MIR@CL, Université

Plus en détail

Pelleas : Le projet XML pour le systeme d information documentaire du polytechnicum de Marne- la Vallée

Pelleas : Le projet XML pour le systeme d information documentaire du polytechnicum de Marne- la Vallée Pelleas : Le projet XML pour le systeme d information documentaire du polytechnicum de Marne- la Vallée Odile ARTUR (CNRS), chef de projet PELLEAS Christine FABRE-BROWAEYS (UMLV), directrice du CRI Résumé

Plus en détail

LES DOSSIERS DOCUMENTAIRES ELECTRONIQUES. Clotilde VAISSAIRE CV CONSEIL SARL Clotilde.vaissaire@wanadoo.fr

LES DOSSIERS DOCUMENTAIRES ELECTRONIQUES. Clotilde VAISSAIRE CV CONSEIL SARL Clotilde.vaissaire@wanadoo.fr LES DOSSIERS DOCUMENTAIRES ELECTRONIQUES Clotilde VAISSAIRE CV CONSEIL SARL Clotilde.vaissaire@wanadoo.fr 1 DEFINITION Le dossier documentaire réunit (en format papier comme en format électronique) un

Plus en détail

I/ CONSEILS PRATIQUES

I/ CONSEILS PRATIQUES D abord, n oubliez pas que vous n êtes pas un enseignant isolé, mais que vous appartenez à une équipe. N hésitez jamais à demander des idées et des conseils aux autres collègues (linguistes et autres)

Plus en détail

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Architecture d'entreprise : Guide Pratique de l'architecture Logique Guides Pratiques Objecteering Architecture d'entreprise : Guide Pratique de l'architecture Logique Auteur : Version : 1.0 Copyright : Softeam Equipe Conseil Softeam Supervisée par Philippe Desfray Softeam

Plus en détail

Traitement numérique de l'image. Raphaël Isdant - 2009

Traitement numérique de l'image. Raphaël Isdant - 2009 Traitement numérique de l'image 1/ L'IMAGE NUMÉRIQUE : COMPOSITION ET CARACTÉRISTIQUES 1.1 - Le pixel: Une image numérique est constituée d'un ensemble de points appelés pixels (abréviation de PICture

Plus en détail

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv> Langage HTML (2 partie) «Je n'ai fait que prendre le principe d - hypertexte et le relier au principe du TCP et du DNS et alors boum! ce fut le World Wide Web!» Tim Berners-Lee

Plus en détail

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION DES NOMBRES par Jean-Luc BREGEON professeur formateur à l IUFM d Auvergne LE PROBLÈME DE LA REPRÉSENTATION DES NOMBRES On ne conçoit pas un premier enseignement

Plus en détail

Gestion electronique de document

Gestion electronique de document Gestion electronique de document Gestion electronique de document (GED) Introduction La gestion électronique de documents (GED) permet de remplacer des "documents papier" par leur forme "électroniques".

Plus en détail

CORBA. (Common Request Broker Architecture)

CORBA. (Common Request Broker Architecture) CORBA (Common Request Broker Architecture) Projet MIAGe Toulouse Groupe 2 1 CORBA, introduction (1/4) Les systèmes répartis permettent de créer des applications basées sur des composants auto-gérables,

Plus en détail

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes

Plus en détail

Chapitre 22 Optimisation pour diffusion à l'écran, pour le web

Chapitre 22 Optimisation pour diffusion à l'écran, pour le web 1 1 9 9 7 7 Optimisation pour diffusion à l'écran, pour le web Diffusion pour le web........................ 31 Les paramètres avant l exportation................. 31 Optimisation pour le web......................

Plus en détail

SMPMKPOO=aKbKbKpK=qÉÅÜåáèìÉë=kìã êáèìéë=éí= jìäíáã Çá~=J=abbpqkj

SMPMKPOO=aKbKbKpK=qÉÅÜåáèìÉë=kìã êáèìéë=éí= jìäíáã Çá~=J=abbpqkj SMPMKPOO=aKbKbKpK=qÉÅÜåáèìÉë=kìã êáèìéë=éí= jìäíáã Çá~=J=abbpqkj 6030.3221 - Référentiel de formation A - Objectif, prérequis, motivation et emplois visés : Objectif Donner les principes fondamentaux concernant

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

OPTION INFORMATIQUE EN CLASSE DE SECONDE. UN EXEMPLE DE PROGRESSION PÉDAGOGIQUE (suite et fin)

OPTION INFORMATIQUE EN CLASSE DE SECONDE. UN EXEMPLE DE PROGRESSION PÉDAGOGIQUE (suite et fin) 97 OPTION INFORMATIQUE EN CLASSE DE SECONDE : UN EXEMPLE DE PROGRESSION PÉDAGOGIQUE (suite et fin) Cet article décrit les dernières séances de ma progression pédagogique en option informatique au niveau

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

UE 8 Systèmes d information de gestion Le programme

UE 8 Systèmes d information de gestion Le programme UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications

Plus en détail

BES WEBDEVELOPER ACTIVITÉ RÔLE

BES WEBDEVELOPER ACTIVITÉ RÔLE BES WEBDEVELOPER ACTIVITÉ Le web developer participe aux activités concernant la conception, la réalisation, la mise à jour, la maintenance et l évolution d applications internet/intranet statiques et

Plus en détail

Vocabulaire juridique multilingue comparé. Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne

Vocabulaire juridique multilingue comparé. Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne Vocabulaire juridique multilingue comparé Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne 22 novembre 2012 Vocabulaire juridique multilingue comparé La Cour

Plus en détail

Les Ateliers Info Tonic

Les Ateliers Info Tonic Les Ateliers Info Tonic La dématérialisation des processus documentaires Mardi 9 octobre 2012 8h30-10h30 Grand Salon La Gestion Electronique de l Information et des Documents d Entreprise Environnement

Plus en détail

UML (Diagramme de classes) Unified Modeling Language

UML (Diagramme de classes) Unified Modeling Language UML (Diagramme de classes) Unified Modeling Language Sommaire Introduction Objectifs Diagramme de classes Classe (Nom, attribut, opération) Visibilité et portée des constituants d une classe Association

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES

LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES Compétences mises en jeu durant l'activité : Compétences générales : S'impliquer, être autonome. Compétence(s) spécifique(s) : Reconnaître des signaux de nature

Plus en détail

Les images et les animations sur le web. Guérineau Chloé BTS2 Année 2001/2012

Les images et les animations sur le web. Guérineau Chloé BTS2 Année 2001/2012 Les images et les animations sur le web Guérineau Chloé BTS2 Année 2001/2012 Sommaire I) Les images sur le web 1) Qu est ce qu une image? Les images numériques, destinées à être visualisées sur les écrans

Plus en détail

mission. Le premier poste du programme de travail du DREV vise la qualification, la quantification et le suivi

mission. Le premier poste du programme de travail du DREV vise la qualification, la quantification et le suivi Dans le cadre de la mission le DREV est chargé de conduire des études et expérimentations permettant de mieux comprendre les usages en matière de consommation de produits culturels en ligne et de produire

Plus en détail

Un ordinateur, c est quoi?

Un ordinateur, c est quoi? B-A.BA Un ordinateur, c est quoi? Un ordinateur, c est quoi? Un ordinateur est une machine dotée d'une unité de traitement lui permettant d'exécuter des programmes enregistrés. C'est un ensemble de circuits

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Toute personne souhaitant maîtriser les techniques liées à la conception de produits multimédia et à la création de sites Web.

Toute personne souhaitant maîtriser les techniques liées à la conception de produits multimédia et à la création de sites Web. Web Designer Durée 90 jours (630 h) Public Toute personne souhaitant maîtriser les techniques liées à la conception de produits multimédia et à la création de sites Web. Objectifs La formation Web designer

Plus en détail

Master Technologies numériques appliquées à l'histoire Deuxième année

Master Technologies numériques appliquées à l'histoire Deuxième année Master Technologies numériques appliquées à l'histoire Deuxième année Octobre 2014 Octobre Novembre Décembre Semaine 1 Semaine 2 Semaine 3 Semaine 4 Semaine 5 Semaine 6 Semaine 7 Semaine 8 Semaine 9 Semaine

Plus en détail

La gestion électronique de documents

La gestion électronique de documents La gestion électronique de documents La GED (Gestion Électronique de Documents) ou GEIDE (Gestion Électronique de d'informations et de Documents pour l'entreprise) a pour fonction d'organiser et de gérer

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail

DEMANDE D INFORMATION RFI (Request for information)

DEMANDE D INFORMATION RFI (Request for information) DOD SEICAM RFI Demande d information EVDEC Réf. : RFI_EVDEC- GT5_Outil_reporting_BI_v4.doc Page 1/11 DEMANDE D INFORMATION RFI (Request for information) OUTIL INTÉGRÉ DE REPORTING ET D ANALYSE DÉCISIONNELLE

Plus en détail

Urbanisation des SI. Des composants technologiques disponibles. Urbanisation des Systèmes d'information Henry Boccon Gibod 1

Urbanisation des SI. Des composants technologiques disponibles. Urbanisation des Systèmes d'information Henry Boccon Gibod 1 Urbanisation des SI Des composants technologiques disponibles Urbanisation des Systèmes d'information Henry Boccon Gibod 1 Plan de l'exposé Technologies à la mode disponibles. Bus de données, ETL et EAI

Plus en détail

N 334 - SIMON Anne-Catherine

N 334 - SIMON Anne-Catherine N 334 - SIMON Anne-Catherine RÉALISATION D UN CDROM/DVD CONTENANT DES DONNÉES DU LANGAGE ORAL ORGANISÉES EN PARCOURS DIDACTIQUES D INITIATION LINGUISTIQUE A PARTIR DES BASES DE DONNÉES VALIBEL Introduction

Plus en détail

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014 pascal.dayre@enseeiht.

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014 pascal.dayre@enseeiht. Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS IDS2014, Nailloux 26-28/05/2014 pascal.dayre@enseeiht.fr 1 MVC et le web 27/05/14 2 L'évolution des systèmes informatiques

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

eduscol Ressources pour la voie professionnelle Français Ressources pour les classes préparatoires au baccalauréat professionnel

eduscol Ressources pour la voie professionnelle Français Ressources pour les classes préparatoires au baccalauréat professionnel eduscol Ressources pour la voie professionnelle Ressources pour les classes préparatoires au baccalauréat professionnel Français Présentation des programmes 2009 du baccalauréat professionnel Ces documents

Plus en détail

JEAN-LUC VIRUÉGA. Traçabilité. Outils, méthodes et pratiques. Éditions d Organisation, 2005 ISBN : 2-7081-3260-1

JEAN-LUC VIRUÉGA. Traçabilité. Outils, méthodes et pratiques. Éditions d Organisation, 2005 ISBN : 2-7081-3260-1 JEAN-LUC VIRUÉGA Traçabilité Outils, méthodes et pratiques, 2005 ISBN : 2-7081-3260-1 2 à l assurance qualité Après la définition de la traçabilité dans la métrologie, on peut remarquer que le domaine

Plus en détail