Stratégie pour l'interprétation de documents

Dimension: px
Commencer à balayer dès la page:

Download "Stratégie pour l'interprétation de documents"

Transcription

1 Stratégie pour l'interprétation de documents G. R. CEHEUX (nom collectif) GDR I3 S.A. 5.2 : écrit vincent@univ-tours.fr ; Jean-Marc.Ogier@univ-lr.fr, thierry.paquet@univ-rouen.fr Résumé. Les problématiques inhérentes aux différentes types de documents sont présentées. On précise les possibilités qui sont désormais ouvertes par les avancées de la recherche. 1 INTRODUCTION Les documents se sont multipliés et loin de rendre nul le rôle du papier, l informatisation rend de plus en plus important la possibilité de traiter des documents écrits. Ils présentent des caractéristiques qui dépendent de l usage de ces documents. Les traitements et leurs possibilités actuelles seront donc spécifiques. Nous distinguerons les documents structurés, les documents manuscrits qu ils soient hors ligne ou en ligne et les documents graphiques. 2 LE DOCUMENT STRUCTURE L'analyse de documents dits structurés concerne le traitement numérique d'images de documents à forte teneur textuelle dont les contenus respectent un modèle de présentation et d'organisation qui permet d'aider à leur compréhension par le lecteur. Cette activité s est principalement développée autour d une problématique de rétroconversion de documents. L objectif des premiers travaux visait la réalisation de systèmes de lecture complètement automatisés de documents papiers, numérisés au moyen d un scanner ou d une caméra.

2 276 Actes des deuxièmes assises nationales du GdR I3 A partir de la description la plus pauvre qui soit du document (matrice de pixels), il s agit donc de pouvoir extraire la structure physique, donnant le format de mise en page, et le contenu de chacun des éléments de cette structure (textes, tableaux, graphiques, images) pour ensuite reconstruire la structure logique du document qui décrit l'enchaînement de sousstructures (titres, sections, paragraphes ). La détection de ces informations implicitement représentées dans l image initiale permet alors de lire le document mais surtout de le ré-utiliser électroniquement avec des logiciels de composition et de production de documents ou dans une base de données. Force est de constater qu'aujourd'hui tous les problèmes ne sont pas résolus et que si certaines applications dédiées fonctionnent correctement, il n'existe pas de système permettant de traiter tous les types de document car ils peuvent être très complexes. 2.1 Enjeux Les enjeux sont aussi bien d'ordre socio-économique que scientifique. Les industriels se sont rapidement emparés des techniques pour développer des produits de lecture automatique. En effet, les applications telles que le tri postal, la reconnaissance des montants des chèques ou l'analyse automatique de formulaires pour la vente par correspondance ou pour les grandes administrations permettent un gain de productivité et raccourcissent les délais de réponse. L'évolution de l'internet et des réseaux de communication en ligne a rendu indispensable la reconnaissance optique de caractères et de documents pour la gestion électronique de documents (GED). Nombre de documents ou de parties de document circulent sous forme image sur le Web. De même, les outils développés permettent d'offrir des solutions interactives pour l'apprentissage de l'écriture et de la lecture et le concept du livre ou du cartable électronique manipule les structures du document pour offrir la possibilité d'une lecture nomade de toute une bibliothèque. Mais l'efficacité de tous ces systèmes n'est pas encore suffisante dès lors que les documents sont complexes de par leur structure ou leur typographie. Lorsque les documents analysés sont de simples textes avec une structure hiérarchisée bien définie, la lecture automatique de ces documents est guidée par un modèle explicite ou implicite du type de document et la conversion numérique est aisée. Mais ce n'est pas le cas pour les documents où l'information n'est pas toujours très organisée et le contenu est hétérogène (mélange d'imprimé, de manuscrit et de graphiques) comme pour les formulaires, les documents postaux ou techniques, les chèques, les magazines ou les documents d'archives. Les documents

3 Interprétation de documents 277 anciens posent également des difficultés car leur typographie n'est pas conventionnelle. 2.2 Etats des lieux scientifique Les techniques de traitement d'images et de reconnaissance des formes semblent mûres dans un contexte général mais force est de constater qu'elles ne sont performantes que lorsque la qualité des documents saisis est bonne, qu'il s'agisse du document original ou de l'opération de numérisation. Cet aspect concerne notamment la numérisation de collections de documents anciens pour lesquels les techniques de numérisation et de pré-traitement doivent encore être améliorées pour offrir au plus grand nombre l'accès à cette information. Ceci reste un problème récurrent pour tenter une quelconque extraction d'information d'un document. La littérature présente de nombreuses solutions de segmentation mais toutes ne sont pas adaptées aux documents rencontrés qui peuvent présenter des diversités importantes de fond et de disposition typographique. Le traitement des couleurs pour la séparation entre texte et fond est aussi un problème non encore résolu et les outils de reconnaissance de caractères (OCR) donnent des résultats de l'ordre de 99,98 % sur des documents imprimés de bonne qualité mais le défi consiste à atteindre les 100%. La combinaison de classifieurs semblent être une piste intéressante pour améliorer ces scores mais le problème du multi-linguisme n'est pas encore complètement traité. Il apparaît également que les travaux concernant les éléments bi-dimensionnels tels que les tableaux ou les formules mathématiques qui sont essentiellement représentées sous forme image dans les documents circulant sur le Web méritent d'être améliorés. D'autre part, l'état de la recherche montre que si la structure physique peut s'extraire de manière relativement correcte, la reconstruction de la structure logique reste un problème ouvert notamment pour des documents complexes ou peu structurés. Actuellement, les systèmes s'orientent plutôt sur les techniques de recherche d'information qui donnent de bons résultats sur les documents textuels mais l'image d'un document est un enjeu sur lequel les techniques de recherche d'information butent encore. Ainsi la recherche dans le domaine ne se limite-t-elle pas seulement à la rétro-conversion de documents mais il s'agit d'avancer pour l'aide à l'archivage, la recherche d'information pertinente et la ré-utilisation des documents. Aussi il faut songer à développer des outils d'hyper-textualisation des documents pour une mise en ligne sur le Web et l extraction des méta-données pour l'indexation. Se pose alors la question des usages des documents : pour qui et dans quel contexte? L'utilisateur devient le centre du système et la

4 278 Actes des deuxièmes assises nationales du GdR I3 modélisation de ses buts et de son usage du document est aujourd'hui une problématique émergente car il conditionne les traitements à mettre en œuvre. Dans cet esprit, il convient donc de prendre soin à la présentation des informations extraites et de concevoir de nouvelles architectures logicielles permettant de fusionner des informations de nature hétérogène. Ceci entraîne bien sûr des problèmes de définition d'interfaces Homme- Machine où l'écriture joue un grand rôle mais aussi des problèmes de gestion de cohérence et par là même de conflit, et amène à modéliser l'utilisateur et à définir des scénarios d'usage où des traitements locaux peuvent être guidés par l'utilisateur. Ceci concerne aussi la reformulation des informations des documents pour les retranscrire sur différents média comme les PDA's ou les e_books. Des études de modélisation du processus de lecture devraient être utiles et des outils de traitement automatique de la langue permettraient en outre d'améliorer sensiblement le dialogue entre l'utilisateur et la machine. Mais les documents ne sont pas tous imprimés, ils ont d abord été manuscrits. Leur étude a été abordée plus récemment et on va voir que si certains problèmes demeurent d autres sont plus spécifiques. 3 LE DOCUMENT MANUSCRIT Pendant assez longtemps on a fait une distinction entre le manuscrit en ligne et le manuscrit hors ligne, car leurs données de base étaient différentes. Actuellement leurs techniques de reconnaissance sont assez voisines. La distinction entre les deux types d'écriture repose plutôt sur les conditions d'acquisition des données et sur les applications qui ont été développées. 3.1 Le document manuscrit hors ligne Au cours de la dernière décennie, des progrès remarquables ont été réalisés dans le domaine de la reconnaissance de l écriture. Longtemps focalisées sur des problèmes de reconnaissance de mots pour les quelques applications phares du domaine (lecture d adresses, lecture de chèques), la reconnaissance de l écriture à partir d images vise aujourd hui le traitement et l analyse de documents beaucoup moins contraints. Moins contraints tant du point de vue de la mise en page que du point de vue du vocabulaire de travail. Si on se limite au seul problème de la reconnaissance de mots manuscrits, on peut considérer que les techniques de modélisation de l écriture reposant sur les Modèles de Markov Cachés

5 Interprétation de documents 279 associés aux réseaux de neurones permettent d atteindre aujourd hui des taux de reconnaissance significatifs pour des problèmes de reconnaissance omni-scripteurs (tout style d écriture). Toutefois les approches les plus performantes restent très sensibles à la taille du lexique de travail. C est donc ce qui freine actuellement leur utilisation dans des applications moins contraintes comme par exemple l analyse et l indexation de textes manuscrits. L analyse de la mise en page d un document manuscrit est une étape indispensable et préalable à son indexation par le contenu. La variabilité inhérente à l écriture manuscrite repousse les techniques développées pour l analyse des documents structurés à leurs limites. Cette problématique appelle de nouveaux développements pour parvenir, par exemple, à analyser des courrier libres, des brouillons d auteurs, etc Il nous semble qu'aujourd'hui le moment soit venu de faire le point sur la notion de document manuscrit. De quelques mots manuscrits, d'une signature ou une adresse on envisage maintenant des documents de plus grande envergure, de vrais documents manuscrits. Cet aspect a induit une modification dans l'approche de la reconnaissance, l'adaptation au scripteur remplace l'objectif omniscripteur qui prévalait jusqu'alors. Sont devenus les objets de recherche (i) l'extraction d'information dans les documents manuscrits ;(ii) la navigation dans les documents anciens ;(iii) l'authentification. De nombreux problèmes restent évidemment à résoudre pour le traitement des textes longs qui appellent l'utilisation d'un lexique ouvert. Les problèmes d'extraction de la structure viennent s'y ajouter lorsqu'apparaissent des chevauchements ou des corrections qui empiètent sur le corps principal du texte. Mais le développement dont on attend le plus est la recherche d'informations Extraction de l'information La rétroconversion d'un document manuscrit sous forme électronique n'est pas le seul objectif à atteindre. La fouille de données et en particulier de données textuelles occupe une place importante dans nos préoccupations actuelles. L'information recherchée est diffuse, mais il n'est pas nécessaire de disposer d'un taux de reconnaissance élevé pour extraire des informations sur la nature du message ou son thème. La lecture de certains mots peut résoudre des problèmes. Tout cela nous fait progresser dans la recherche par le contenu, l'indexation, l'extraction de mots clés. Les techniques qui sont nécessaires ici peuvent être qualifiées de haut niveau car elles font appel à des notions d'analyse linguistique et à des modèles de langages.

6 280 Actes des deuxièmes assises nationales du GdR I Navigation dans les documents anciens L'utilisation du WEB a conduit à la scannérisation de nombreux documents qui constituent une partie de notre patrimoine national, notamment des documents anciens ou des archives. Ces documents sont souvent manuscrits et désormais on peut les considérer comme de vrais documents et pas seulement comme de simples images. Il s'agit de mettre en évidence la structuration du document pour en permettre l'analyse. L'étude de ces documents permet de développer des méthodes de compression pour les transferts et bien adaptées à l'utilisation du document Authentification L'authentification d'un document a toujours constitué une préoccupation, dans le domaine administratif mais aussi dans le monde du commerce. L'existence de faussaires, qui trouvent un intérêt à se faire passer pour d'autres, oblige à vérifier la provenance des documents. La signature a longtemps été l'unique moyen d'authentifier un document. Les avancées dans l'étude de l'écriture permettent aujourd'hui de détecter les scripteurs par d'autres éléments, en particulier par l'examen du texte dans lequel peuvent être mis en évidence des invariants ou des indices de forme, qui caractérisent le scripteur. 3.2 Le document manuscrit en-ligne Enjeux Après une période de relative stagnation dans le milieu des années 90, les activités dans le domaine de la reconnaissance de l écriture manuscrite en-ligne sont de nouveau sur le devant de la scène. Ce renversement de tendance se justifie pleinement par l essor important de toutes les technologies liées aux systèmes mobiles de télécommunications. Il s agit là d un jalon significatif, dans l évolution de notre société où des usages nouveaux sont en train de naître basés sur les concepts d ubiquité, de nomadisme, bref d accès en permanence à l information, en tous lieux et en tous temps, et si possible avec le minimum d effort pour l utilisateur. Dans ces situations, la plupart du temps, le clavier n apporte pas les solutions de confort attendu. Dès que la taille du système devient petite, le stylet apparaît comme l'interface naturelle de communication. En vue

7 Interprétation de documents 281 d'interprétation de ce geste lié à l utilisation du stylet, la dynamique correspondante est enregistrée sous la forme de ce qui est communément appelé «encre électronique». Contrairement au papier classique, ici, le support électronique peut réagir aux entrées d'informations, c'est pourquoi on parle d'interactions par le stylo. L utilisation de commandes gestuelles, et en particulier de l écriture manuscrite, se révèle aujourd hui être une alternative crédible comme interface d entrée de ces nouveaux systèmes communicants Les problèmes posés Plusieurs défis se posent alors. Ils concernent d abord des aspects matériels liés à l environnement de saisie. Sans rentrer ici dans les détails, nous pensons en particulier aux matériels de type PDA (assistant numérique), Smartphone (téléphone nouvelle génération), TabletPC (ardoise électronique), Smartdisplays, papier digital, stylo-caméra. Mais ils concernent aussi bien évidemment toutes les méthodes et modèles de représentation, manipulation et interprétation de l information ainsi saisie. Ainsi, toute une problématique nouvelle émerge et un groupe de travail issu du W3C vient de proposer de définir une nouvelle norme XML, appelée InkXML, comme support de description et de manipulation. Nous limiterons par la suite notre présentation à celui du seul domaine de la reconnaissance de l écriture en-ligne L évolution des recherches La reconnaissance de l écriture manuscrite a évolué selon différents degrés de difficultés croissantes. Tout d abord, on s est intéressé à la reconnaissance de caractères isolés, lettres ou chiffres. Les premières solutions, type Graffiti, imposaient le respect de contraintes fortes d écriture, les nouvelles générations permettent de reconnaître des caractères multi-traits et multi-formes. Ensuite, on est passé au niveau des mots et en particulier des mots cursifs. De nombreux travaux de recherche sont encore focalisés sur cette tâche. Enfin, on peut s attaquer à la reconnaissance de phrases, puis de documents en-ligne mixant textes, tableaux, schémas saisis en pleine page sous forme manuscrite. Les solutions de reconnaissance les plus performantes sont basées sur des approches par apprentissage mettant en œuvre des technologies utilisant réseaux de neurones, modèles de Markov cachés, systèmes d inférence floue, ou toutes combinaisons de ces différents outils. Il faut souligner ici tout à la fois, la progression très significative des performances des

8 282 Actes des deuxièmes assises nationales du GdR I3 systèmes de reconnaissance de l écriture manuscrite en-ligne, mais aussi admettre qu aucune solution complète n a été apportée, tant le problème est complexe par nature. Néanmoins, il existe déjà des systèmes en vraie grandeur issus de la recherche, notamment en France (Myscript, Remus, Resif). Les performances atteintes dans le domaine de la reconnaissance en_ligne d écriture manuscrite sont telles que des produits industriels ont pu également voir le jour (MyScript de VisionObjects, Transcriber de Microsoft, Calligrapher de Paragraph, smartwriter de ART, etc.) Les spécificités de la reconnaissance en-ligne Ressources limitées/contraintes temps réel. Par rapport à la reconnaissance hors-ligne, les systèmes en-ligne souffrent de contraintes additionnelles. La plus importante réside dans les capacités limitées, mémoire et processeur, des machines de traitement du fait de leur taille très réduite et de la limitation de leur consommation. La seconde contrainte tient au fait que l utilisateur interagit directement avec le système, celui-ci doit donc lui fournir une réponse en temps réel. Cela a des conséquence importantes sur le choix des algorithmes et leur implantation, notamment dès que les lexiques sont de tailles importantes (quelques centaines de milliers de mots). A l inverse, les systèmes enligne présentent l avantage de n avoir à traiter que le seul signal d écriture, sans être perturbé par le fond de page. Apprentissage/adaptation. Un autre dilemme propre à la reconnaissance en-ligne réside dans le compromis apprentissage/adaptation. En effet, les algorithmes d apprentissage compilent de grosses bases de données et donnent des résultats statistiques optimaux dans un cadre omni-scripteurs. Le problème est qu ensuite la machine est utilisée par un utilisateur unique. Il s avère donc fort utile de pouvoir spécifiquement s adapter au scripteur grâce simplement à quelques échantillons de son écriture. Pour cela des approches structurelles peuvent venir renforcer les méthodes statistiques précédemment évoquées. Cela amène sur la problématique de la combinaison de classifieurs qui est encore un sujet nécessitant des travaux à la fois fondamentaux et expérimentaux Les problèmes ouverts Combinaison d indices visuels et temporels. La complémentarité entre la représentation statique d un caractère et sa graphie ne semble pas

9 Interprétation de documents 283 suffisamment exploitée, elle devrait permettre d accroître la robustesse des classifieurs. Prise en compte d un modèle de langage. Si pour la reconnaissance au niveau mot, seule la connaissance du lexique est nécessaire sa détermination optimale n est d ailleurs pas triviale-, dès que l on cherche à passer au niveau phrase, il devient primordial de modéliser efficacement le langage. Beaucoup de questions restent ouvertes : type de modèle mis en œuvre (syntaxique, statistique), choix d un corpus d apprentissage, adaptation au domaine de discours, gestion de l inconnu, confiance respective du modèle de langage et du reconnaisseur-mot Nouvelles applications L'émergence des technologies orientées stylo et encre électronique, ouvre de nouvelles perspectives et de nouveaux champs d'application aux chercheurs confrontés aux besoins de saisies et d interactions dans le cas des documents électroniques en-ligne. Dans de nombreux domaines, ils restent à faire émerger des applications tirant profit des ces nouvelles interfaces stylet/ordinateur. On peut penser notamment aux domaines de l éducation, du médical, de l édition et des arts graphiques, du livre électronique, de la prise de notes, de relevés de schémas, etc. 4 ANALYSE DE DOCUMENTS GRAPHIQUES 4.1 Enjeux Quel que soit le contexte ou le domaine concerné, le document graphique, ou à forte teneur graphique, est utilisé comme support de représentation d informations dans le cas où le graphisme peut apporter une plus-value par rapport à une information purement textuelle. Les domaines concernés sont très nombreux, et peuvent toucher les informations géoréférencées (cartes géographiques, topologiques hydrographiques, plans cadastraux, plans d accès, etc.), les informations techniques (schémas, plans d architectures, plans d évacuation, etc.), les informations structurelles (organigrammes), ou encore une superposition éventuelles de ces différentes classes d informations (bases de données urbaines, plans de réseaux téléphoniques, électriques, etc.). Quelles que soient les institutions au sein desquelles les documents graphiques servent de support décisionnel, les volumes impliqués sont généralement très importants ( planches cadastrales, plans du réseau

10 284 Actes des deuxièmes assises nationales du GdR I3 téléphonique français ) et l automatisation de leur analyse reste un défi tout à fait essentiel dans le cycle de vie des organismes concernés. Pour faire face à ce défi, différentes stratégies ont été retenues, suivant les usages et les communautés d intérêt concernées. Certains organismes ont opté pour la gestion d armoires électroniques sous forme de documents «morts» (issus d une simple acquisition), alors que d autres ont choisi de procéder à une numérisation manuelle des informations, permettant ainsi de manipuler une information dynamique et mise à jour. Entre ces deux extrêmes, d autres organismes ont opté pour des solutions intermédiaires, consistant par exemple à ne traiter que les documents «vivants» au sens de leur activité (certaines archives ont des taux d utilisation ne justifiant pas toujours un traitement automatisé). Mis à part certains secteurs de haute technologie en CAO-DAO (aéronautique, automobile ), pour lesquels de grands volumes de documents ont fait l objet d une rétroconversion complète, ces différents choix ont conduit à la création de documents numériques de niveaux de structuration variables, et font émerger de nouveaux problèmes relatifs à la navigation dans ces bases documentaires dites «semi-structurées». À côté de ces applications traditionnelles de la reconnaissance de graphiques, de nombreux nouveaux usages apparaissent actuellement, pour lesquels la question n est plus tant de réaliser une rétroconversion de l information véhiculée par le document, mais plutôt d intégrer de manière la plus transparente possible les documents disponibles sous forme papier, voire sous forme électronique, mais faiblement structurée, dans la chaîne globale de documentation de l entreprise. On s intéresse alors à l utilisation des algorithmes de reconnaissance à des fins d indexation par le contenu, voire de réingénierie au moins partielle du contenu. Notion d usages qu il convient de développer afin de montrer que l analyse graphique n est pas que de la rétroconversion Scan to XML 4.2 Etat des lieux scientifique Structure générale des systèmes d analyse Les différents problèmes posés par l analyse de documents graphiques sont assez proches de ceux que l on trouve en analyse et interprétation d images. Une chaîne de traitement intégrant des aspects reconnaissance de graphiques comportera généralement un ensemble d étapes visant à construire des informations structurées en relation avec un domaine particulier, à partir des informations numériques élémentaires (ou de niveau de structuration plus élevé, comme évoqué dans la partie

11 Interprétation de documents 285 précédente) et d informations contextuelles liées aux connaissances sur le métier concerné et à la nature du problème analysé. Bien que certains auteurs proposent des approches systémiques visant à résoudre les problèmes d ambiguïtés sémantiques, la majeure partie de la littérature concerne la mise en œuvre de stratégies ascendantes du pixel vers l objet faisant appel à de nombreux outils de bas niveau, combinés à des dispositifs d analyse syntaxique. Au plus haut niveau, des techniques d analyse sémantique permettent d intégrer des connaissances du domaine, apportant une contribution au processus d interprétation, ou de recherche des informations les plus pertinentes pour l indexation et la navigation. Le workshop GREC, périphérique de la conférence ICDAR, et organisé par le TC10 de l IAPR ( constitue un excellent outil de communication et de publication en la matière ; ses actes permettront au lecteur de trouver des états de l art très riches sur tous les sujets liés à la reconnaissance de graphique Bilan des savoir-faire et des verrous technologiques. Au cours des trois dernières décennies, les nombreux projets industriels ou institutionnels ont permis aux équipes de recherche de faire des avancées significatives dans différents secteurs. De manière tout à fait logique, l énergie a tout d abord été principalement focalisée sur (i) le développement des outils. Se sont alors posés les problèmes d intégration de ces outils dans des contextes évolutifs, avec notamment les questions de (ii) stratégies adaptées à un contexte particulier. Ces approches complémentaires ont permis l émergence de travaux sur la façon (iii) d externaliser les connaissances des systèmes, de façon à adapter (iv) dynamiquement les stratégies d analyse. Nous proposons ci-dessous un panorama de ces différents problèmes, certains d entre eux étant étroitement corrélés. La littérature est particulièrement riche en ce qui concerne les opérateurs dits «de bas niveau» visant à améliorer la qualité des images ou engageant une première étape vers la séparation en couches d informations pixels, pour les phases ultérieures de traitement. Ces traitements concernent les problèmes de binarisation, de multiseuillage, de filtrage de bruit, ou encore de séparation des couches d informations élémentaires (couleur, analyse multi-modale). L extraction d indices fait également l objet de recherches importantes, comme en attestent les nombreuses publications dans le domaine. Elle concerne la séparation texte/graphique, l extraction de régions, la vectorisation, la reconnaissance de caractères et de symboles, dans le cas où les méthodologies employées ne reposent pas sur des approches structurelles. Certains de ces opérateurs (séparation texte/graphique,

12 286 Actes des deuxièmes assises nationales du GdR I3 vectorisation, reconnaissance de symboles ) sont d ailleurs relativement «stabilisés» et la communauté semble considérer que leurs limites de fonctionnement (ou de dysfonctionnement) sont surtout liées au «contexte» (caractéristiques de l image et de la représentation graphique, intention associée au traitement ) dans lequel ils sont utilisés. Malgré cette relative stabilité, il reste des études importantes à mener pour améliorer les performances de plusieurs éléments de ces opérateurs de traitement, en particulier en ce qui concerne la précision, la robustesse et la fiabilité des opérations mises en œuvre. La problématique générale de la caractérisation et de l évaluation de leurs performances est également d une actualité brûlante. D autres problèmes fondamentaux sont posés par le choix de la meilleure adéquation algorithme/donnée, tant en termes de méthodes que de choix de paramètres des outils retenus. Cela passe par une meilleure prise en compte du contexte des traitements, et donc une caractérisation comportementale des outils, en fonction de leur contexte d utilisation. Ces nombreuses questions posent des problèmes de modélisation des traitements en matière de pré et de postconditions, de caractérisation de contexte à partir de signatures issues de l image, et de connaissances contextuelles. Elles soulèvent également le problème de l évaluation de la qualité d un traitement en fonction de son contexte d utilisation. Ces problématiques dépassent bien entendu largement le cadre de l analyse de documents. Les discussions des dernières conférences internationales dans le domaine attestent du besoin de développement en la matière, en suggérant de déployer des recherches sur l externalisation et la modélisation des connaissances implicites et de leur contexte d utilisation. Certaines équipes proposent d ailleurs des approches systémiques, intégrant des outils de modélisation de traitement et de connaissances, afin de piloter dynamiquement les chaînes de traitement. Enfin, à un niveau supérieur, toutes les techniques d analyse structurelle et syntaxique peuvent être développées pour combiner les indices du niveau inférieur afin de reconstruire les objets du domaine. Les grammaires et/ou graphes utilisés pour la représentation des objets graphiques reposent, suivant les domaines, sur des structures à base de vecteurs ou de régions Quelles perspectives de recherche? En matière d analyse de documents graphiques, les nombreuses voies de recherche sont liées à l amélioration des chaînes de traitements développées depuis les dernières décennies (amélioration des outils de traitement, recherche de la bonne adéquation données/algorithme, ), mais sont également corrélées aux nouvelles problématiques émergentes

13 Interprétation de documents 287 (connaissances partagées, intermédiation, réingéniérie et indexation des contenus ), en relation avec la navigation dans les bases de données documentaires hétérogènes et/ou semi-structurées, entre autres à des fins d intermédiation. Concernant ce dernier point, de nombreuses réflexions concernent les mécanismes d annotations, pour permettre une adéquation entre l indexation et les usages liés aux documents analysés. Les recherches actuelles portent sur l adaptation de l analyse à la diversité des usages à ces fins d indexation, ou sur le développement de nouvelles approches. Elles concernent également les problèmes de l organisation et de la structuration des bases, au regard des usages, pour optimiser la recherche d informations. Cet aspect met en évidence la nécessité d ouverture vers les communautés traitant ce type de problèmes. L intégration de l usager et de ses modes de fonctionnement dans la boucle de traitement fait également l objet d études approfondies. Outre les aspects relatifs aux traitements «classiques» des chaînes d analyse d images, conjointement aux points évoqués dans les paragraphes précédents, les difficultés rencontrées par la communauté de l analyse de documents graphiques mettent donc en évidence la nécessité de déployer des études à caractères pluridisciplinaires, pour apporter des solutions constructives aux problématiques émergentes. 5 CONCLUSION On voit ainsi que l'analyse de documents dans toute leur diversité est un domaine pluridisciplinaire qui doit bien sûr orienter ses efforts dans le domaine du traitement d'images et de reconnaissance de formes mais aussi de l'intelligence artificielle, de la linguistique, de la sociologie et des sciences cognitives. 6 RÉFÉRENCES [Revues] International Journal on Document Analysis and Recognition, IEEE Transactions on Pattern Analysis and Machine Intelligence, Machine Vision and Application, Pattern Recognition, Pattern Recognition Letters, Pattern Analysis and Application, Computer Vision and Image Understanding, Traitement du Signal. [Conférences] International Conference on Document Analysis and Recognition, Colloque International Francophone sur l'ecrit et le Document, Colloque International sur le Document Électronique, Workshop on Document Analysis Systems, Workshop on Document Image Analysis, International

14 288 Actes des deuxièmes assises nationales du GdR I3 Workshop on Frontiers in Handwriting Recognition, International Workshop on Graphics Recognition, International Workshop on Web Document Analysis.

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

ISTEX, vers des services innovants d accès à la connaissance

ISTEX, vers des services innovants d accès à la connaissance ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions

Plus en détail

Les ressources numériques

Les ressources numériques Les ressources numériques Les ressources numériques sont diverses et regroupent entre autres, les applications, les bases de données et les infrastructures informatiques. C est un ensemble de ressources

Plus en détail

TEXT MINING. 10.6.2003 1 von 7

TEXT MINING. 10.6.2003 1 von 7 TEXT MINING 10.6.2003 1 von 7 A LA RECHERCHE D'UNE AIGUILLE DANS UNE BOTTE DE FOIN Alors que le Data Mining recherche des modèles cachés dans de grandes quantités de données, le Text Mining se concentre

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Gestion collaborative de documents

Gestion collaborative de documents Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,

Plus en détail

Dématérialisation et document numérique (source APROGED)

Dématérialisation et document numérique (source APROGED) Dématérialisation et document numérique (source APROGED) La dématérialisation se répand très rapidement dans tous les domaines d'activités. Depuis l'origine, le concept de dématérialisation repose sur

Plus en détail

I.R.I.S. annonce la disponibilité d'iriscapture Pro 7 for Invoices, la nouvelle version de son logiciel de reconnaissance de factures.

I.R.I.S. annonce la disponibilité d'iriscapture Pro 7 for Invoices, la nouvelle version de son logiciel de reconnaissance de factures. COMMUNIQUE DE PRESSE Bruxelles, le 22 juin 2005 I.R.I.S. annonce la disponibilité d'iriscapture Pro 7 for Invoices, la nouvelle version de son logiciel de reconnaissance de factures. Une solution robuste

Plus en détail

SECTION 5 BANQUE DE PROJETS

SECTION 5 BANQUE DE PROJETS SECTION 5 BANQUE DE PROJETS INF 4018 BANQUE DE PROJETS - 1 - Banque de projets PROJET 2.1 : APPLICATION LOGICIELLE... 3 PROJET 2.2 : SITE WEB SÉMANTIQUE AVEC XML... 5 PROJET 2.3 : E-LEARNING ET FORMATION

Plus en détail

S3CP. Socle commun de connaissances et de compétences professionnelles

S3CP. Socle commun de connaissances et de compétences professionnelles S3CP Socle commun de connaissances et de compétences professionnelles Référentiel Le présent socle décrit un ensemble de connaissances et compétences devant être apprécié dans un contexte professionnel.

Plus en détail

Projet de programme pour l enseignement d exploration de la classe de 2 nde : Informatique et création numérique

Projet de programme pour l enseignement d exploration de la classe de 2 nde : Informatique et création numérique Projet de programme pour l enseignement d exploration de la classe de 2 nde : Informatique et création numérique 19 mai 2015 Préambule L informatique est tout à la fois une science et une technologie qui

Plus en détail

La gestion électronique de documents

La gestion électronique de documents La gestion électronique de documents La GED (Gestion Électronique de Documents) ou GEIDE (Gestion Électronique de d'informations et de Documents pour l'entreprise) a pour fonction d'organiser et de gérer

Plus en détail

Rapport d'analyse des besoins

Rapport d'analyse des besoins Projet ANR 2011 - BR4CP (Business Recommendation for Configurable products) Rapport d'analyse des besoins Janvier 2013 Rapport IRIT/RR--2013-17 FR Redacteur : 0. Lhomme Introduction...4 La configuration

Plus en détail

Document d accompagnement pour le référentiel national du C2i niveau 2 Métiers de l environnement et de l aménagement durables

Document d accompagnement pour le référentiel national du C2i niveau 2 Métiers de l environnement et de l aménagement durables Document d accompagnement pour le référentiel national du C2i niveau 2 Métiers de l environnement et de l aménagement durables A - Compétences générales et transversales liées à l exercice des métiers

Plus en détail

Contenu disciplinaire (CK)

Contenu disciplinaire (CK) Compilation des suggestions apportées par les participants aux ateliers du Rendez-vous des conseillers pédagogiques Colloque de l AQPC 2013 Application technologique Trouver les causes, la biologie derrière

Plus en détail

FICHE DE POSTE. Date de rédaction : 20/02/15. Argumentaire général

FICHE DE POSTE. Date de rédaction : 20/02/15. Argumentaire général UNIVERSITE LYON 2 (LUMIERE) Référence GALAXIE : 4217 Numéro dans le SI local : Référence GESUP : F002 Corps : Maître de conférences Article : 26-I-1 Chaire : Non Section 1 : 71-Sciences de l'information

Plus en détail

Activité : Élaboration, mise en forme et renseignement de documents

Activité : Élaboration, mise en forme et renseignement de documents ACTIVITÉS ADMINISTRATIVES À CARACTÈRE TECHNIQUE Activité : Élaboration, mise en forme et renseignement de documents Tâche : Rédaction de messages et de courriers professionnels simples liés à l activité

Plus en détail

Dévéloppement de Sites Web

Dévéloppement de Sites Web 1 Dévéloppement de Sites Web Cours I : Conception et spécification d'un site à thème Peter Stockinger Séminaire de Maîtrise en Communication Interculturelle à l'institut National des Langues et Civilisations

Plus en détail

MASTER LPL : LANGUE ET INFORMATIQUE (P)

MASTER LPL : LANGUE ET INFORMATIQUE (P) MASTER LPL : LANGUE ET INFORMATIQUE (P) RÉSUMÉ DE LA FORMATION Type de diplôme := Master Domaine : Arts, Lettres, Langues Mention : LITTERATURE, PHILOLOGIE, LINGUISTIQUE Spécialité : LANGUE ET INFORMATIQUE

Plus en détail

LES INTERFACES HOMME-MACHINE

LES INTERFACES HOMME-MACHINE LES INTERFACES HOMME-MACHINE 1 ère Partie : Introduction aux Interfaces Homme-Machine 2 ème Partie : Notions de base sur les Sciences Cognitives 3 ème Partie : Recommandations ergonomiques 4 ème Partie

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

BRZ GED : Il n'y a pas que sur vos chantiers que nous vous ferons gagner en productivité!

BRZ GED : Il n'y a pas que sur vos chantiers que nous vous ferons gagner en productivité! BRZ GED : Il n'y a pas que sur vos chantiers que nous vous ferons gagner en productivité! Introduction Les avantages d une GED : 1. Sécurise les données de votre entreprise : La GED devient la mémoire

Plus en détail

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ.

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ. Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ. un FLUX DE TRAVAIL AUTOMATIQUEMENT AMÉLIORÉ. C est un fait, même si votre bureau est parfaitement organisé, les

Plus en détail

LES FICHES Domaines. Domaine D1. Travailler dans un environnement numérique

LES FICHES Domaines. Domaine D1. Travailler dans un environnement numérique LES FICHES Domaines Domaine D1 Travailler dans un environnement numérique D1.1 Organiser un espace de travail complexe D1.1.a Connaître le principe de localisation physique des ressources locales et distantes

Plus en détail

Etapes de création d une revue électronique

Etapes de création d une revue électronique Economique Site web du guide des ressources pour l édition de revues numériques Coordination : Ghislaine Chartron et Jean-Michel Salaun Doctorant en sciences de l'information Cette analyse vise à donner

Plus en détail

Bachelier Bibliothécaire- Documentaliste!

Bachelier Bibliothécaire- Documentaliste! Bachelier Bibliothécaire- Documentaliste Structure du profil d'enseignement et du programme d'études détaillé Année académique : 2015-2016 Haute Ecole Paul-Henri Spaak Catégorie sociale (IESSID) 1 1. Le

Plus en détail

Qu'est-ce que le BPM?

Qu'est-ce que le BPM? Qu'est-ce que le BPM? Le BPM (Business Process Management) n'est pas seulement une technologie mais, dans les grandes lignes, une discipline de gestion d'entreprise qui s'occupe des procédures contribuant

Plus en détail

Elaborer un «Référentiel d Organisation 2.0»

Elaborer un «Référentiel d Organisation 2.0» Elaborer un «Référentiel d Organisation 2.0» Process Oriented, Human Centric & Graphic dans l environnement Microsoft SharePoint avec Microsoft Office Visio - Septembre 2009 - Présentateur : Cédric Berger

Plus en détail

I) - DEFINITIONS I-A) TERMINOLOGIE

I) - DEFINITIONS I-A) TERMINOLOGIE Venise CANABADY Lycée Amiral Bouvet St Benoît PARTIE I - DEFINITIONS PARTIE II - LES GRANDES FONCTIONNALITES DE LA GED PARTIE III - GED : INDEXATION ET OUTILS PARTIE IV- LA GESTION ÉLECTRONIQUE DES DOCUMENTS

Plus en détail

Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année

Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année PALIER 2 CM2 La maîtrise de la langue française DIRE S'exprimer à l'oral comme à l'écrit dans un vocabulaire approprié

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

CAHIER DES CLAUSES TECHNIQUES PARTICULIÈRES (CCTP) MISE EN PLACE ET MAINTENANCE D UN MOTEUR DE RECHERCHE

CAHIER DES CLAUSES TECHNIQUES PARTICULIÈRES (CCTP) MISE EN PLACE ET MAINTENANCE D UN MOTEUR DE RECHERCHE PREMIER MINISTRE SECRÉTARIAT GÉNÉRAL DU GOUVERNEMENT CAHIER DES CLAUSES TECHNIQUES PARTICULIÈRES (CCTP) MISE EN PLACE ET MAINTENANCE D UN MOTEUR DE RECHERCHE SUR LES SITES INTERNET GÉRÉS PAR LA DOCUMENTATION

Plus en détail

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2 éducalgo Manuel d utilisation 26 juin 2011 Table des matières 1 Tâche à effectuer : écrire un algorithme 2 2 Comment écrire un algorithme? 3 2.1 Avec quoi écrit-on? Avec les boutons d écriture........

Plus en détail

Les enjeux de la dématérialisation du courrier entrant

Les enjeux de la dématérialisation du courrier entrant Les enjeux de la dématérialisation du courrier entrant EMC Solutions for Digital MailRoom 1 Introduction à l Input Management 2 Une organisation dépendante des flux papier? Site 1 Gestionnaires Formulaires

Plus en détail

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ. VOUS POUVEZ COMPTER SUR NOUS

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ. VOUS POUVEZ COMPTER SUR NOUS Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ. VOUS POUVEZ COMPTER SUR NOUS un FLUX DE TRAVAIL AUTOMATIQUEMENT AMÉLIORÉ. C est un fait, même si votre bureau

Plus en détail

Communiqué de Lancement

Communiqué de Lancement Direction du Marketing Produits Sage - Division Mid Market Communiqué de Lancement Rapprochement Bancaire 1000 Produit : Rapprochement Bancaire 1000 Bases de Données : Oracle - MS/SQL Server Microsoft

Plus en détail

Brique BDL Gestion de Projet Logiciel

Brique BDL Gestion de Projet Logiciel Brique BDL Gestion de Projet Logiciel Processus de développement pratiqué à l'enst Sylvie.Vignes@enst.fr url:http://www.infres.enst.fr/~vignes/bdl Poly: Computer elective project F.Gasperoni Brique BDL

Plus en détail

S e r v i r l e s clients actuels de maniè r e e f f ic a ce grâce a u «Co n s u m er Insight»

S e r v i r l e s clients actuels de maniè r e e f f ic a ce grâce a u «Co n s u m er Insight» Siège mondial : 5 Speen Street Framingham, MA 01701 États-Unis P.508.935.4400 F.508.988.7881 www.idc-ri.com S e r v i r l e s clients actuels de maniè r e e f f ic a ce grâce a u «Co n s u m er Insight»

Plus en détail

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES Techniques symboliques de traitement automatique du langage pour l indexation thématique et l extraction d information temporelle Thèse Défense publique

Plus en détail

Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE Contact : Mme Lapedra, stage@isoft.fr ISoft, éditeur de logiciels, est spécialisé dans l informatique décisionnelle et l analyse de données. Son expertise

Plus en détail

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ.

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ. Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ. un FLUX DE TRAVAIL AUTOMATIQUEMENT AMÉLIORÉ. C est un fait, même si votre bureau est parfaitement organisé, les

Plus en détail

LECTURE CRITIQUE. Accompagner les enseignants et formateurs dans la conception d une formation en ligne

LECTURE CRITIQUE. Accompagner les enseignants et formateurs dans la conception d une formation en ligne LECTURE CRITIQUE Accompagner les enseignants et formateurs dans la conception d une formation en ligne Christian Ernst E-learning. Conception et mise en œuvre d un enseignement en ligne Guide pratique

Plus en détail

Bibliothèque des Compétences clés

Bibliothèque des Compétences clés Bibliothèque des Compétences clés Modules Jours Heures S exprimer oralement 3 21 S exprimer à l écrit 4 28 Manipuler les chiffres et les ordres de grandeur 5 35 Utiliser les principaux outils bureautiques

Plus en détail

ÉCONOMIE ET GESTION LYCÉES TECHNOLOGIQUE ET PROFESSIONNEL

ÉCONOMIE ET GESTION LYCÉES TECHNOLOGIQUE ET PROFESSIONNEL ÉCONOMIE ET GESTION LYCÉES TECHNOLOGIQUE ET PROFESSIONNEL Au niveau du second degré, l'économie et gestion recouvre un ensemble de champs disciplinaires relevant de l'économie, du droit, des sciences de

Plus en détail

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues Maud Ehrmann Joint Research Centre Ispra, Italie. Guillaume Jacquet Xerox

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail

Plan de formation Personnel de l UCE

Plan de formation Personnel de l UCE Plan de formation Personnel de l UCE Juin 2015 Sommaire Contexte Termes de référence du consultant Environnementales et Sociales Termes de référence pour l archivage électronique des documents Proposition

Plus en détail

Politique de gestion documentaire

Politique de gestion documentaire Politique de gestion documentaire Responsabilité de gestion : Secrétariat général Date d approbation : 24 avril 1979 C.A. C.E. Direction générale Direction Date d'entrée en vigueur : 24 avril 1995 Date

Plus en détail

Domaine 1 : S approprier un environnement informatique de travail. Domaine 3 : Créer, produire, traiter et exploiter des données.

Domaine 1 : S approprier un environnement informatique de travail. Domaine 3 : Créer, produire, traiter et exploiter des données. Les différents domaines sont : Domaine 1 : S approprier un environnement informatique de travail. Domaine 2 : Adopter une attitude responsable. Domaine 3 : Créer, produire, traiter et exploiter des données.

Plus en détail

GED: Gestion Electronique de Document (Support de cours) R. MAHMOUDI (mahmoudr@esiee.fr) www.research-ace.net/~mahmoudi 1 Gestion Electronique de Documents Plan du cours - Introduction générale - Spécificités

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas

Plus en détail

Technologie SDS (Software-Defined Storage) de DataCore

Technologie SDS (Software-Defined Storage) de DataCore Technologie SDS (Software-Defined Storage) de DataCore SANsymphony -V est notre solution phare de virtualisation du stockage, dans sa 10e génération. Déployée sur plus de 10000 sites clients, elle optimise

Plus en détail

Les utilisations pédagogiques du Tableau Numérique Interactif (TNI) dans l enseignement d Économie-Gestion :

Les utilisations pédagogiques du Tableau Numérique Interactif (TNI) dans l enseignement d Économie-Gestion : Les utilisations pédagogiques du Tableau Numérique Interactif (TNI) dans l enseignement d Économie-Gestion : Pascal ROOS Professeur d Économie Gestion Lycée Edmond Rostand, Saint Ouen l Aumône (95) Face

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

BASE DE DONNÉES ORACLE 11G SUR LE SYSTÈME DE STOCKAGE PILLAR AXIOM. Livre blanc publié par Oracle Novembre 2007

BASE DE DONNÉES ORACLE 11G SUR LE SYSTÈME DE STOCKAGE PILLAR AXIOM. Livre blanc publié par Oracle Novembre 2007 BASE DE DONNÉES ORACLE 11G SUR LE SYSTÈME DE STOCKAGE PILLAR AXIOM Livre blanc publié par Oracle Novembre 2007 BASE DE DONNÉES ORACLE 11G SUR LE SYSTÈME DE STOCKAGE PILLAR AXIOM RESUME Oracle 11g Real

Plus en détail

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton Linked Open Data Le Web de données Réseau, usages, perspectives Sommaire Histoire du Linked Open Data Structure et évolution du réseau Utilisations du Linked Open Data Présence sur le réseau LOD Futurs

Plus en détail

MÉTHODOLOGIE DE L ASSESSMENT CENTRE L INSTRUMENT LE PLUS ADÉQUAT POUR : DES SÉLECTIONS DE QUALITÉ DES CONSEILS DE DÉVELOPPEMENT FONDÉS

MÉTHODOLOGIE DE L ASSESSMENT CENTRE L INSTRUMENT LE PLUS ADÉQUAT POUR : DES SÉLECTIONS DE QUALITÉ DES CONSEILS DE DÉVELOPPEMENT FONDÉS MÉTHODOLOGIE DE L ASSESSMENT CENTRE L INSTRUMENT LE PLUS ADÉQUAT POUR : DES SÉLECTIONS DE QUALITÉ ET DES CONSEILS DE DÉVELOPPEMENT FONDÉS 1. Introduction Placer la «bonne personne au bon endroit» représente

Plus en détail

Nouveau Web Client marquant, Cumulus Video Cloud, optimisations de la base de données, et plus..

Nouveau Web Client marquant, Cumulus Video Cloud, optimisations de la base de données, et plus.. INFORMATION PRODUIT : Quoi de Neuf dans Cumulus 9.0? Nouveau Web Client marquant, Cumulus Video Cloud, optimisations de la base de données, et plus.. Les nouveautés marquantes et les améliorations disponibles

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

Gestion de la Relation Client (GRC)

Gestion de la Relation Client (GRC) Techniques de DM pour la GRC dans les banques Page 2 I.1 Introduction La gestion de la relation client est devenue un processus essentiel dans les institutions bancaires. Ils essaient toujours d améliorer

Plus en détail

Intelligence d affaires nouvelle génération

Intelligence d affaires nouvelle génération Intelligence d affaires nouvelle génération Sept étapes vers l amélioration de l intelligence d affaires par l entremise de la recherche de données À PROPOS DE CETTE ÉTUDE Les approches traditionnelles

Plus en détail

Portail collaboratif Intranet documentaire Dématérialisation de processus

Portail collaboratif Intranet documentaire Dématérialisation de processus Portail collaboratif Intranet documentaire Dématérialisation de processus 2 Le groupe Divalto, Solutions de gestion Catalyseur de performance Créé en 1982, le groupe Divalto propose des solutions de gestion

Plus en détail

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION Mentions

Plus en détail

INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES

INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et

Plus en détail

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT Remarque : Tous les cours sont en français, sauf contre-indication. Pour des traductions anglaises des titres, des descriptifs, et plus de renseignements, consultez l intégralité du Programme des enseignements

Plus en détail

Business Intelligence

Business Intelligence avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................

Plus en détail

Tarification comparative pour l'industrie des assurances

Tarification comparative pour l'industrie des assurances Étude technique Tarification comparative pour l'industrie des assurances Les technologies de l'information appliquées aux solutions d'affaires Groupe CGI inc., 2004. Tous droits réservés. Aucune partie

Plus en détail

La solution pour gérer vos connaissances techniques et scientifiques

La solution pour gérer vos connaissances techniques et scientifiques La solution pour gérer vos connaissances techniques et scientifiques La solution pour gérer, sécuriser et réutiliser vos connaissances techniques et scientifiques TEEXMA est le premier outil collaboratif

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Quels outils pour prévoir?

Quels outils pour prévoir? modeledition SA Quels outils pour prévoir? Les modèles de prévisions sont des outils irremplaçables pour la prise de décision. Pour cela les entreprises ont le choix entre Excel et les outils classiques

Plus en détail

Garantir une meilleure prestation de services et une expérience utilisateur optimale

Garantir une meilleure prestation de services et une expérience utilisateur optimale LIVRE BLANC Garantir une meilleure prestation de services et une expérience utilisateur optimale Mai 2010 Garantir une meilleure prestation de services et une expérience utilisateur optimale CA Service

Plus en détail

GEDEXPERT. La Gestion Electronique de Documents des PME PMI. VOTRE NOUVEL ASSISTANT pour. Pour partager l information au sein de l entreprise

GEDEXPERT. La Gestion Electronique de Documents des PME PMI. VOTRE NOUVEL ASSISTANT pour. Pour partager l information au sein de l entreprise La Gestion Electronique de Documents des PME PMI è GEDEXPERT Pour partager l information au sein de l entreprise Compatible avec vos outils de gestion et de bureautique. Base de données SQL sécurisée.

Plus en détail

Progiciel K. Parce que chaque K est unique (c) 2005-2013 K-all

Progiciel K. Parce que chaque K est unique (c) 2005-2013 K-all Progiciel K Parce que chaque K est unique (c) 2005-2013 K-all Progiciel K pour une gestion intégrée sur mesure puissante et évolutive dans un environnement full Web. Internet, Extranet et Nomade. Le Progiciel

Plus en détail

Citations «TICE» dans les programmes de l école primaire

Citations «TICE» dans les programmes de l école primaire Citations «TICE» dans les programmes de l école primaire 1) Qu'apprend-on à l'école maternelle? (Ed. 2002-II) Introduction / Cinq domaines d activités pour structurer les apprentissages - Page 62 : Aux

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Leica Application Suite. Archive

Leica Application Suite. Archive Leica Application Suite Archive Archivage LAS pour la microscopie numérique Les solutions professionnelles et personnalisées de gestion des données numériques n'ont jamais été aussi recherchées, notamment

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

Qu est-ce qu une problématique?

Qu est-ce qu une problématique? Fiche méthodologique préparée par Cécile Vigour octobre 2006 1 Qu est-ce qu une problématique? Trois étapes : 1. Définition de la problématique 2. Qu est-ce qu une bonne problématique? 3. Comment problématiser?

Plus en détail

Université du Québec à Trois-Rivières Politique de gestion des documents actifs, semi-actifs et inactifs de l'u.q.t.r.

Université du Québec à Trois-Rivières Politique de gestion des documents actifs, semi-actifs et inactifs de l'u.q.t.r. Université du Québec à Trois-Rivières Politique de gestion des documents actifs, semi-actifs et inactifs de l'u.q.t.r. (Résolution 398-CA-3497, 25 novembre 1996) 1. Énoncé Par cette politique, l'université

Plus en détail

Fiche méthodologique Rédiger un cahier des charges

Fiche méthodologique Rédiger un cahier des charges Fiche méthodologique Rédiger un cahier des charges Plan de la fiche : 1 : Présentation de la fiche 2 : Introduction : les grands principes 3 : Contenu, 1 : positionnement et objectifs du projet 4 : Contenu,

Plus en détail

Logiciel de Gestion Electronique de Dossiers

Logiciel de Gestion Electronique de Dossiers Logiciel de Gestion Electronique de Dossiers 1, rue de la République 69001 LYON Tel 04.78.30.62.41 Fax 04.78.29.55.58 www.novaxel.com Logiciel de GED NOVAXEL Présentation du logiciel NOVAXEL La GED d'organisation

Plus en détail

Contrôle interne et organisation comptable de l'entreprise

Contrôle interne et organisation comptable de l'entreprise Source : "Comptable 2000 : Les textes de base du droit comptable", Les Éditions Raouf Yaïch. Contrôle interne et organisation comptable de l'entreprise Le nouveau système comptable consacre d'importants

Plus en détail

La gestion globale des contenus d entreprise

La gestion globale des contenus d entreprise Gonzague Chastenet de Géry La gestion globale des contenus d entreprise Le projet ECM, une nouvelle approche de la gestion de l information é d i t i o n s Les Editions de l ADBS publient des ouvrages

Plus en détail

Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos

Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos Laurent Veillard UMR ICAR (CNRS, Université Lyon 2, ENS de lyon)

Plus en détail

Chapitre 1 : Introduction aux bases de données

Chapitre 1 : Introduction aux bases de données Chapitre 1 : Introduction aux bases de données Les Bases de Données occupent aujourd'hui une place de plus en plus importante dans les systèmes informatiques. Les Systèmes de Gestion de Bases de Données

Plus en détail

La GEIDE. Dans une solution GEIDE, il est possible d'associer au sein même d'un dossier:

La GEIDE. Dans une solution GEIDE, il est possible d'associer au sein même d'un dossier: La GEIDE Historique de La GEIDE Anciennement "Archivage électronique", La Gestion électronique de Documents "GED" est apparu dans les années 80. Mais le terme GED paraissait restrictif par rapport à ses

Plus en détail

Répondre à un courrier - Transférer un courrier 20

Répondre à un courrier - Transférer un courrier 20 avec Présentation de l'écran d'internet Explorer 5 3 Se connecter sur un site distant à partir de l'adresse URL du site Se connecter sur un site distant en utilisant les favoris 5 6 Enregistrer un site

Plus en détail

Programmation d'agents intelligents Vers une refonte des fils de raisonnement. Stage de fin d'études Master IAD 2006

Programmation d'agents intelligents Vers une refonte des fils de raisonnement. Stage de fin d'études Master IAD 2006 vendredi 8 septembre 2006 Programmation d'agents intelligents Vers une refonte des fils de raisonnement Stage de fin d'études Master IAD 2006 Benjamin DEVEZE Responsable : M. Patrick TAILLIBERT Plan Plan

Plus en détail

Tâche complexe produite par l académie de Clermont-Ferrand. Mai 2012 LE TIR A L ARC. (d après une idée du collège des Portes du Midi de Maurs)

Tâche complexe produite par l académie de Clermont-Ferrand. Mai 2012 LE TIR A L ARC. (d après une idée du collège des Portes du Midi de Maurs) (d après une idée du collège des Portes du Midi de Maurs) Table des matières Fiche professeur... 2 Fiche élève... 5 1 Fiche professeur Niveaux et objectifs pédagogiques 5 e : introduction ou utilisation

Plus en détail

N 334 - SIMON Anne-Catherine

N 334 - SIMON Anne-Catherine N 334 - SIMON Anne-Catherine RÉALISATION D UN CDROM/DVD CONTENANT DES DONNÉES DU LANGAGE ORAL ORGANISÉES EN PARCOURS DIDACTIQUES D INITIATION LINGUISTIQUE A PARTIR DES BASES DE DONNÉES VALIBEL Introduction

Plus en détail

Introduction à l informatique temps réel Pierre-Yves Duval (cppm)

Introduction à l informatique temps réel Pierre-Yves Duval (cppm) Introduction à l informatique temps réel Pierre-Yves Duval (cppm) Ecole d informatique temps réel - La Londes les Maures 7-11 Octobre 2002 -Définition et problématique - Illustration par des exemples -Automatisme:

Plus en détail

PRESENTATION DU. DE LA Gestion Eléctronique des Documents ( GED)

PRESENTATION DU. DE LA Gestion Eléctronique des Documents ( GED) PRESENTATION DU PROJET DE LA Gestion Eléctronique des Documents ( GED) Immeuble FIATA.Bld circulaire.01 BP 4773 Lomé Togo Tél. : +228 220 16 81 / Fax : +228 220 26 62 COE N 082709F E-mail : netitogo@gmail.com

Plus en détail

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2 NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2 Résultats aux évaluations nationales CM2 Annexe 1 Résultats de l élève Compétence validée Lire / Ecrire / Vocabulaire / Grammaire / Orthographe /

Plus en détail

TP SIN Traitement d image

TP SIN Traitement d image TP SIN Traitement d image Pré requis (l élève doit savoir): - Utiliser un ordinateur Objectif terminale : L élève doit être capable de reconnaître un format d image et d expliquer les différents types

Plus en détail

AccuRead OCR. Guide de l'administrateur

AccuRead OCR. Guide de l'administrateur AccuRead OCR Guide de l'administrateur Avril 2015 www.lexmark.com Contenu 2 Contenu Aperçu...3 Applications prises en charge...3 Formats et langues pris en charge...4 Performances de l'ocr...4 Exemples

Plus en détail

Document d aide au suivi scolaire

Document d aide au suivi scolaire Document d aide au suivi scolaire Ecoles Famille Le lien Enfant D une école à l autre «Enfants du voyage et de familles non sédentaires» Nom :... Prénom(s) :... Date de naissance :... Ce document garde

Plus en détail

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv> Langage HTML (2 partie) «Je n'ai fait que prendre le principe d - hypertexte et le relier au principe du TCP et du DNS et alors boum! ce fut le World Wide Web!» Tim Berners-Lee

Plus en détail