Solutions de traitement du document textuel avec prise en charge de ressources linguistiques
|
|
|
- Samuel Thibault
- il y a 10 ans
- Total affichages :
Transcription
1 135 Schedae, 2006 Prépublication n 17 Fascicule n 1 Solutions de traitement du document textuel avec prise en charge de ressources linguistiques Abderrafih Lehmam Pertinence Mining SARL 82, avenue Jean Jaurès Vitry sur Seine, France [email protected] Résumé : Dans cette article nous avons choisi de présenter quelques solutions de traitement du document utilisant la technologie du text mining. Nous avons toutefois insisté sur celle du résumé de texte automatique. Après avoir défini le text mining nous avons d abord exposé une architecture construite informatiquement autour de ressources et de techniques linguistiques. L avenir des solutions en text mining ne fait que commencer avec l avènement Internet et la profusion du document électronique. Mots-clés : résumé automatique de texte, résumé automatique, plate-forme de veille, intelligence économique, outil de veille, cartographie de l information Abstract : The paper presents some solutions in text mining, with special focus on automatic summarization and applications to Arabic. After providing a definition of text mining, we describe a software architecture based on linguistic resources and techniques, and give an overview of several summarization techniques. This is only a beginning in the future of text mining technologies, with the growing prevalence of the Internet. Keywords : summarizer, automatic summarization, text summarization, document summarization, watch platform, information mapping Introduction Dans le monde professionnel il est important de mettre à disposition des technologies de traitement de l information permettant d aller rapidement à l essentiel dans un document textuel. Le but étant d assister l utilisateur, par des outils, afin qu il puisse passer moins de temps à chercher l information et davantage à en exploiter le contenu essentiel. Le traitement automatique du langage (TAL), de plus en plus, remplacé par le concept «Text Mining» chez Abderrafih Lehmam «Solutions de traitement du document textuel avec prise en charge de ressources linguistiques»
2 136 les professionnels, offre des possibilités réelles pour répondre aux besoins exprimés au niveau du traitement de document électronique. En effet, au vu du flot d information que nous connaissons ; accéder aujourd hui à l information textuelle utile est devenu un vrai «casse-tête» pour l utilisateur en quête d information textuelle réutilisable. Le Text Mining répond, en parti, à cette problématique. L étude du text mining repose particulièrement sur des liens très étroits entre des recherches en linguistique textuelle et sur les formalisations adéquates en vue d une réalisation informatique. L enjeu est ici de pouvoir d un côté valider la pertinence des recherches théoriques entreprises en linguistique et de l autre de pouvoir les rendre utiles pour la réalisation de logiciels efficaces en discernant entre ce qui peut être «informatisable» et ce qui ne peut pas l être. Le but est de produire des technologies réellement utilisées dans le monde professionnel telles que le résumé de texte automatique, les plates-formes de veille (technologique, sanitaire, intelligence économique ), la cartographie de l information textuelle issue de l actualité ou encore les moteurs et les métamoteurs de recherche sur Internet. Nous nous proposons dans cet article, d abord d exposer des technologies en ce domaine développées par la société Pertinence Mining et ensuite de les illustrer par des exemples illustrant des situations concrètes d utilisation. Nous nous focaliserons, toutefois, par manque de place, que sur la technologie du résumé de texte automatique. Dès lors, nous ne présenterons que rapidement les autres solutions sachant que ses technologies intègrent, toutes, la fonctionnalité de résumé de texte automatique. La méthode utilisée est initiée des travaux introduits par Edmundson (1968). Cette même méthode a été améliorée par plusieurs chercheurs, chacun y apportant une «valeur ajoutée» dans ses écrits et dans ses réalisations (Paice 1990, Lehmam , Radev 2000). Avec l avènement du document textuel électronique suite au développement fulgurant de l informatique, des besoins réels se posent maintenant au niveau de l extraction de l information utile noyée dans des gigaoctets voire des téraoctets de données textuelles véhiculées dans les différents supports et infrastructures numériques. Devant les besoins naissant provoqués par cette réalité préoccupante, nous avons tout naturellement choisi d axer nos recherches et développements, dans le cadre de la société Pertinence Mining, dans ce qu on appelle aujourd hui le text mining. Ce domaine de recherche propose de répondre au besoin d extraction, de filtrage et d exploitation d un flot d informations textuelles toujours plus abondant par des solutions liant les deux disciplines la linguistique et l informatique pour apporter des réponses à un besoin qui sera de plus en plus problématique et forcément tendant à s accroître dans l avenir. Les solutions que nous développons visent la résolution des problèmes liés à la surabondance d information. On peut définir le text mining comme ce processus qui permet d analyser le texte pour extraire les informations efficientes en vue d une réutilisation bénéfique pour des buts précis. Des outils s appuyant sur des méthodes principalement linguistiques, et parfois, faisant appel aux techniques des réseaux neuronaux, de la statistique ou du datamining, traduites dans des codes informatiques pour permettre de «comprendre» (mining) artificiellement le texte (text) en vue d extraire une quantité d information limitée mais pertinente afin de répondre au besoin recherché qui est principalement le gain de temps pour une meilleure productivité mais aussi l aide à la prise de décision. Dans le cadre du colloque ISDD 06, nous proposons de faire des démonstrations d applications conçues de façon à permettre le traitement intelligent de l information documentaire, en puisant dans des ressources linguistiques multilingues, pour l analyse, la recherche et l extraction de l information pertinente pour une meilleure utilisation. Ces solutions œuvrent dans : Le résumé de texte automatique multilingue ; La veille multilingue : collecte, traitement, visualisation, diffusion et exploitation ;
3 137 La cartographie de l information textuelle avec mesure de visibilité (baromètre) ; La méta-recherche avec filtrage des résultats des moteurs de recherche classiques. Nous nous contentons dans cet écrit à décrire rapidement la solution de résumé automatique. La solution Pertinence Summarizer ( identifie les phrases les plus pertinentes d un texte en vue de leur extraction pour la constitution d un résumé, paramétrable dynamiquement. Cette application tient compte de la spécificité du texte et de sa thématique (domaines) en se fondant exclusivement sur des techniques d analyse linguistique du discours. Quelques points précisant ce qui est pris en charge lors du traitement : reconnaissance d éléments phrastiques pour évaluer la pertinence de la phrase en vue de sa sélection pour la constitution du résumé ; traitement morpho-syntaxique, dictionnaire morphologique spécifique ; base synonymique spécifique, terminologie du domaine, personnalisation par utilisateur ; structuration de la base des marqueurs selon les domaines ; spécialisation par domaine en vue de produire des résumés tenant compte du thème du texte ; Intégrations de thésaurus pour appuyer en pertinence les résumé produits ; prise en compte des termes pour les besoins d utilisateur, ce dernier est invité à entrer des termes/expressions en vue d aiguiller le résultat du résumé par rapport son besoin ; aide à la lecture rapide par coloration nuancée des phrases au moyen la couleur choisie ; navigation sur les termes d un domaine donné avec possibilité d extraction des synonymes, d antonymes ainsi que d autres relations sémantiques mais aussi des entités nommés trouvées dans le texte. Dans l exemple de copie d écran de Pertinence Summarizer ci-dessous (figure 1), il est montré une extraction des termes descripteurs du domaine juridique avec reconnaissance des termes non-descripteurs et descripteurs, en couleur jaune. En couleur rouge sont indiqués les termes non-descripteur exprimant la relation de synonymie (sanction pénale condamnation). Figure 1 : Extraction des termes d un domaine avec mise en relief de la relation de synonymie.
4 138 Cette fonctionnalité montre le degré d intelligence artificielle avancée du logiciel dans la mesure où l utilisateur a accès, en plus du résumé automatique, à la connaissance par l acquisition, la compréhension et l enrichissement de son capital lexique d un domaine donné grâce aux relations sémantiques explicitées automatiquement. Cette solution d accès rapide à l information textuelle est intégrée d office dans tous les outils 1 de Pertinence Mining. Ces derniers sont tous testables en ligne sur Internet. La prise en compte de ressources linguistiques va nous permettre la réalisation de fonctionnalités avancées dans Pertinence Summarizer : il est possible, par exemple, de naviguer sur les termes d un domaine donné avec possibilité d extraction de différentes relations sémantiques, à la demande : synonymes, antonymes, homonymes, sigles, entités nommés, etc. Une aide à la lecture rapide par coloration nuancée des phrases est aussi possible. L interface de soumission du document textuel à résumer propose diverses possibilités pour non seulement pouvoir extraire l information importante mais aussi pouvoir aider l utilisateur à exploiter cette dernière par la lecture rapide ou la lecture en diagonale du texte source. D autres fonctionnalités purement pragmatico-informatiques vont elles permettre la récupération des références anaphoriques orphelines. Pertinence Summarizer va non seulement, permettre de résumer des documents issus d un support matériel (disque dur, disquette, clefs USB, etc.), d une URL Internet ou intranet, d un copié/collé mais aussi de résumer automatiquement l ensemble des documents d un dossier ou d un répertoire et ceci en un seul clic. C est cette dernière fonctionnalité que nous avons choisie de montrer comme seconde illustration pour le traitement de la langue arabe. Par exemple, en imaginant que l utilisateur se trouve confronté à la réalisation d un rapport ou d un mémoire de thèse de doctorat ou autre, une solution pouvant résumer automatiquement un dossier de documents ne peut que lui faire gagner du temps quant à leur exploration. Dans ce cas précis, les résumés automatiques pourront rapidement lui fournir suffisamment d informations pertinentes pour l aiguiller vers le texte utile parmi un nombre important de documents présents dans un dossier. Le traitement de plusieurs dossiers ne peut que l assister dans sa productivité. Nous donnons ci-dessous un exemple traitant un dossier contenant de nombreux textes en langue arabe (figure 2). Figure 2 : Résumé automatique à la volée de nombreux documents contenus dans un répertoire. 1. Pertinence Information Network : plate-forme de veille ( PODoo : métamoteur de recherche ( Connivences : cartographie intelligente de l actualité (
5 139 Cette fonctionnalité permet l exploration rapide de l information pertinente qui est ici facilitée devant un gros volume de textes. Les résumés automatiques produits par Pertinence Summarizer à partir d un dossier ou d un répertoire vont donner suffisamment d informations efficientes pour que l utilisateur puisse décider de porter son choix sur les textes les plus intéressants à dépouiller. Ensuite, le bouton «Résumé avancé» va lui permettre d explorer en dynamique le texte source afin de récupérer rapidement l information quêtée. L intégration de terminologies ou de thesaurus par domaines thématiques va permettre des fonctionnalités intelligentes de text mining ou de fouille de texte comme montré plus haut. Conclusion La technologie du text mining est une discipline qui tendra à ce développer dans l avenir car les documents textuels électroniques sont devenus d un usage vulgarisé et ce dans une proportion toujours croissante. Comme le résumé automatique de texte, nous verrons de plus en plus apparaître des solutions innovantes qui proposeront des outils de traitement du document textuel pour faciliter l accès à l information. Pour notre part, nous continuons à réfléchir à d autres applications qui se fonderont strictement sur des ressources et des techniques linguistiques en vue de répondre à un problème crucial : la maîtrise de l information. La difficulté à résoudre reste toutefois l élaboration de bonnes formalisations qui permettraient de faire collaborer en bonne intelligence les deux disciplines à savoir la linguistique et l informatique. Bibliographie EDMUNDSON H.P. (1968), «New methods in automatic extraction», Journal of the ACM, 16 (2), p LEHMAM A. (1999), «Text structuration leading to an automatic summary system», Information Processing and Management, 35, p , 1999, Elsevier Science, New York, USA. LEHMAM A (2002), «Résumé de texte automatique : vers des solutions professionnelles», Journée ATALA sur le résumé de texte automatique initiée et organisée par A. Lehmam (Pertinence Mining, Paris) avec l aide du laboratoire du Pr. J.-P. Desclés (LaLICC FRE 2520 CNRS Paris IV) ENST Paris, décembre LEHMAM A. (2006a), «Solutions de Text Mining pour l intelligence économique, vers la veille intelligente», Congrès TELMI 06 organisé par l ARIST Nord-Pas de Calais et l Université de Lille 3 (Master GIDE-PRISME UFR IDIST) «Les Outils de Veille Stratégique», 30 mars 2006, Lille, France. LEHMAM A. (2006b), «Technologie textuelle multilingue», AAFD 06 2 e Journées Thématiques «Apprentissage Artificiel et Fouille de Données», Université Paris 13, Institut Galilée, avril, Paris, France. LEHMAM A., BOUVET P. (2004a), «Watch application, summarization and syndication in Arabic», in Proceedings of the conference nemlar '04 «arabic language resources and tools conference», p , Septembre 2004, Le Caire, Égypte. LEHMAM A., BOUVET P. (2004b), «Un résumeur automatique de textes multilingues intégré dans une plate-forme de veille ; application à la langue arabe», in Actes de la conférence JEP-TALN-RECITAL 2004, p , Fès, Maroc. PAICE C.D. (1990), «Constructing literature abstracts by computer techniques and prospects», Information Processing and Management, 1, New York, Elsevier Science, p RADEV D (2000), «Summarization of multiple documents : clustering, sentence extraction», ANLP-NAACL Workshop on Automatic Summarization, April 2000, Seattle, USA.
6 140
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax [email protected],
Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus
JEP-TALN 2004, Traitement Automatique de l Arabe, Fès, 20 avril 2004 Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus ZAAFRANI Riadh Faculté des Sciences Juridiques,
Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques
Guide de recherche documentaire à l usage des doctorants Partie : Exploiter les bases de données académiques Sylvia Cheminel Dernière mise à jour : décembre 04 PANORAMA DES SOURCES DOCUMENTAIRES ACADEMIQUES...
ISTEX, vers des services innovants d accès à la connaissance
ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions
Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar [email protected]
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar [email protected] Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Entreposage de données complexes pour la médecine d anticipation personnalisée
Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée
Table des matières. Préface...5. Introduction...9
Préface......................................................5 Introduction..................................................9 Chapitre 1 Diversité des besoins, diversité des contenus........................13
Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA
RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE
Mendeley, pour gérer sa bibliographie et la partager. Patricia Volland-Nail
Mendeley, pour gérer sa bibliographie et la partager Patricia Volland-Nail Avertissement Ce diaporama est le support d une formation qui a été dispensée à l URFIST de Bordeaux le 29 Novembre 2013 Il nécessite
Dafoe Présentation de la plate-forme UIMA
Laboratoire d Informatique de l université Paris-Nord (UMR CNRS 7030) Institut Galilée - Université Paris-Nord 99, avenue Jean-Baptiste Clément 93430 Villetaneuse, France 11 juillet 2007 Plates-formes
DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION
OBJECTIFS GÉNÉRAUX DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION Découvrir les principales fonctionnalités des outils de
THOT - Extraction de données et de schémas d un SGBD
THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) [email protected], [email protected] Mots clefs : Fouille d information, base de données, système
De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues
De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues Maud Ehrmann Joint Research Centre Ispra, Italie. Guillaume Jacquet Xerox
INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude
INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude
Les documents primaires / Les documents secondaires
Les documents primaires / Les documents secondaires L information est la «matière première». Il existe plusieurs catégories pour décrire les canaux d information (les documents) : - Les documents primaires
GKR. Geological Knowledge Representation Base de connaissances métallogéniques
GKR Geological Knowledge Representation Base de connaissances métallogéniques Objets Organiser un ensemble d informations complexes et hétérogènes pour orienter l exploration minière aux échelles tactiques
Vocabulaire juridique multilingue comparé. Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne
Vocabulaire juridique multilingue comparé Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne 22 novembre 2012 Vocabulaire juridique multilingue comparé La Cour
Le concept de veille. Définitions. Définition de l AFNOR
Le concept de veille OPERMIND Alain DELABY / UFR TOURS Ecole Doctorale 17-18 et 19 mars 2004 1 Définitions Définition du Commissariat du Plan : L intelligence économique est l ensemble des actions coordonnées
TEXT MINING. 10.6.2003 1 von 7
TEXT MINING 10.6.2003 1 von 7 A LA RECHERCHE D'UNE AIGUILLE DANS UNE BOTTE DE FOIN Alors que le Data Mining recherche des modèles cachés dans de grandes quantités de données, le Text Mining se concentre
PRISE EN MAIN RAPIDE
PRISE EN MAIN RAPIDE sommaire DÉCOUVREZ VOTRE UNIVERS ELnetdirectionjuridique.fr PAGE CONNECTEZVOUS ET CRÉEZ VOTRE COMPTE PERSONNEL PAGE PERSONNALISEZ VOTRE PAGE D ACCUEIL PAGE 5 5 NAVIGUEZ FACILEMENT
SECTION 5 BANQUE DE PROJETS
SECTION 5 BANQUE DE PROJETS INF 4018 BANQUE DE PROJETS - 1 - Banque de projets PROJET 2.1 : APPLICATION LOGICIELLE... 3 PROJET 2.2 : SITE WEB SÉMANTIQUE AVEC XML... 5 PROJET 2.3 : E-LEARNING ET FORMATION
BIG Data et R: opportunités et perspectives
BIG Data et R: opportunités et perspectives Guati Rizlane 1 & Hicham Hajji 2 1 Ecole Nationale de Commerce et de Gestion de Casablanca, Maroc, [email protected] 2 Ecole des Sciences Géomatiques, IAV Rabat,
Master Informatique Aix-Marseille Université
Aix-Marseille Université http://masterinfo.univ-mrs.fr/ Département Informatique et Interactions UFR Sciences Laboratoire d Informatique Fondamentale Laboratoire des Sciences de l Information et des Systèmes
Méthode de classification des réponses d un moteur de recherche
SETIT 2005 3 rd International Conference: Sciences of Electronic, Technologies of Information and Telecommunications March 27-31, 2005 TUNISIA Méthode de classification des réponses d un moteur de recherche
Europresse.com. Pour les bibliothèques publiques et de l enseignement. Votre meilleur outil de recherche en ligne. Guide version 1.
Europresse.com Pour les bibliothèques publiques et de l enseignement Votre meilleur outil de recherche en ligne Guide version 1.5 CEDROM-SNi Comprendre la page d accueil 1. Bandeau de navigation 2. Espace
TEXT MINING Tour d Horizon
TEXT MINING Tour d Horizon Media Campus WAN IFRA "Structurer, optimiser et valoriser son contenu éditorial : les outils de text mining" 24 novembre 2009, PARIS Philippe BONNY Cabinet de Conseil et d Etudes
La recherche documentaire
La recherche documentaire Séance destinée aux étudiants (BAC2) de la Haute Ecole de la Ville de Liège Catégorie pédagogique (instituteur primaire) Enseignant : Thomas Herremans Nancy Durieux 9 novembre
CommentWatcher. plateforme Web open-source pour analyser les discussions sur des forums en ligne. Marian-Andrei RIZOIU
CommentWatcher plateforme Web open-source pour analyser les discussions sur des forums en ligne Marian-Andrei RIZOIU 2ème octobre 2013 BLEND 2013 Lyon, France Contexte Laboratoire ERIC Université Lumière
CONTACT EXPRESS 2011 ASPIRATEUR D EMAILS
CONTACT EXPRESS 2011 ASPIRATEUR D EMAILS MANUEL D UTILISATION Logiciel édité par la société I. PREAMBULE a) Avant propos... 3 b) Support... 3 c) Interface d accueil... 4 à 5 d) Interface de Recherche...
Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA
Masses de données 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Rédacteurs : Mjo Huguet / N. Jozefowiez 1. Introduction : Besoins Informations et Aide
Une méthode d apprentissage pour la composition de services web
Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia [email protected],
www.breizhconsulting.fr Centre de formation digital et communication : www. Komelya.fr
«Optimiser une campagne google adwords» Merci de mettre votre portable en mode silencieux Mais vous pouvez twitter C est au programme Comment ça fonctionne? À quoi devez-vous faire attention? Comment trouver
«Un logiciel de gestion des références bibliographiques : pourquoi faire?»
«Un logiciel de gestion des références bibliographiques : pourquoi faire?» Pr. Smain BALASKA Maison du Doctorant Université d Oran Comment gérer ma bibliographie - 06/06/2014 1 La terminologie logiciels
et de la feuille de styles.
Feuilles de style / mars 2007 Manuel d'utilisation du modèle enssib et de la feuille de styles. Writer Open Office Service des produits documentaires Contact : Richard Grenier 2e étage enssib Tél : 04
16 septembre 2013. Lundi de l Economie l. rencement. Foix. CCI Ariège
Lundi de l Economie l Numérique 16 septembre 2013 Lundi de l Economie l Numérique Le référencementr rencement Foix CCI Ariège Définition Référencement naturel Le référencement (SEO, Search Engine Optimization)
Cliquez pour du modifier titre le style
Service de la bibliothèque Université du Québec à Trois-Rivières Cliquez Recherche pour modifier documentaire le style Cliquez pour du modifier titre le style Ergothérapie du 18 avril titre 2013 Cliquez
La solution pour gérer vos connaissances techniques et scientifiques
La solution pour gérer vos connaissances techniques et scientifiques La solution pour gérer, sécuriser et réutiliser vos connaissances techniques et scientifiques TEEXMA est le premier outil collaboratif
LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS
LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS Annuaire Ouvrage publié en principe chaque année ou selon une périodicité proche de l'année, qui donne une liste de noms de personnes ou d'organismes
Premier colloque international sur la veille stratégique multilingue. Université de Genève (ETI, Suisse) 28-29 mai 2008
Premier colloque international sur la veille stratégique multilingue Université de Genève (ETI, Suisse) 28-29 mai 2008 La Veille multilingue : défense et illustration de la traduction stratégique Mathieu
Christelle MAZIERE (30 ans)
Christelle MAZIERE (30 ans) Villa Orcéa, Lieu-dit Pertérato 20212 Favalello di Boziu 06.35.58.13.21 [email protected] COMPÉTENCES PARTICULIÈRES Enseignement Gestion de corpus de données : recueil,
Accès instantané aux mots et aux locutions Le dictionnaire électronique offre une traduction rapide d'un mot ou d'une locution
@promt Office 8.0 Description abrégée Spécifiquement conçu pour la maison et les petites entreprises Traduction de documents, de courriers électroniques et de messages instantanés ICQ Traduction de pages
Entrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS
Quatrième colloque hypermédias et apprentissages 275 BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS Anne-Olivia LE CORNEC, Jean-Marc FARINONE,
Recherche et veille documentaire scientifique
Recherche et veille documentaire scientifique Élodie Chattot BU Médecine Pharmacie juin 2006 Introduction Le but de cet atelier est de vous initier à la méthodologie de recherche documentaire scientifique,
Recherche bibliographique
Séminaire «Maîtrise de l information scientifique» Recherche bibliographique Dernière mise à jour : 07/01/2015 - Auteur : Frédérique Flamerie Recherche bibliographique : méthode & outils La recherche bibliographique
sommaire L organisation et la gestion des archives d entreprise...7
sommaire La formation continue à l EBAD... 3 Niveau i... 4 La chaine de traitement archivistique... 4 Initiation aux techniques documentaires... 5 Organisation et gestion des bibliothèques... 6 Niveau
QUI SOMMES-NOUS? Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, disposant ou non d une structure de veille dédiée.
PRESENTATION QUI SOMMES-NOUS? La société VIEDOC, formée d ingénieurs expérimentés, conseille depuis 2004 les entreprises dans les domaines de la veille, de l intelligence économique et de l innovation.
Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel
Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel Excel est un des meilleurs outils de manipulation de données et parfois il est nécessaire d exploiter des données
Lecture critique et pratique de la médecine
1-00.qxp 24/04/2006 11:23 Page 13 Lecture critique appliquée à la médecine vasculaireecture critique et pratique de la médecine Lecture critique et pratique de la médecine Introduction Si la médecine ne
Apprentissage Automatique
Apprentissage Automatique Introduction-I [email protected] www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Quels apprentissages info-documentaires au collège?
Quels apprentissages info-documentaires au collège? Quel cadre? Quels apprentissages associés? 1983 : Éducation aux médias (EAM) 1986 : Initiation à la recherche documentaire (IRD) 2003 : Information-Documentation
WINDOWS SHAREPOINT SERVICES 2007
WINDOWS SHAREPOINT SERVICES 2007 I. TABLE DES MATIÈRES II. Présentation des «content types» (Type de contenu)... 2 III. La pratique... 4 A. Description du cas... 4 B. Création des colonnes... 6 C. Création
demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs de recherche?
50 questions essentielles à vous poser avant la mise en ligne de votre site pour ne plus vous demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs
Le Product Backlog, qu est ce c est?
Le Product Backlog, qu est ce c est? Ludovic Larché Agile Tour 2012 à Rennes le 4 octobre 2012 Sommaire > Rappels théoriques : qu est ce qu un Product Backlog? > Le Product Backlog n est pas seul! > Techniques
Pentaho Business Analytics Intégrer > Explorer > Prévoir
Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho lie étroitement intégration de données et analytique. En effet, les services informatiques et les utilisateurs métiers peuvent accéder aux
Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox
Des données à la connaissance client A la découverte de la plateforme de connaissance client knowlbox Livre blanc mai 2013 A l heure du Big Data, les entreprises s interrogent davantage sur leurs données.
Créer et gérer des catégories sur votre site Magento
Créer et gérer des catégories sur votre site Magento Version utilisée pour l élaboration de ce guide : Magento 1.3.0 Rédigé par : Olivia Contexte Pour créer un site sous Magento, vous allez être obligé
PRÉSENTATION PRODUIT. Plus qu un logiciel, la méthode plus efficace de réconcilier.
PRÉSENTATION PRODUIT Plus qu un logiciel, la méthode plus efficace de réconcilier. Automatiser les réconciliations permet d optimiser l utilisation des ressources et de générer plus de rentabilité dans
Classification Automatique de messages : une approche hybride
RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,
Installation d un manuel numérique 2.0
Installation d un manuel numérique 2.0 Après la commande d un manuel numérique enrichi, le Kiosque Numérique de l Education envoie un email de livraison (sous 24h pour les commandes passées par Internet
Memento de la recherche documentaire en santé
Memento de la recherche documentaire en santé Optimiser ses recherches - Se procurer les documents Rédiger sa bibliographie 1. QUELQUES CONSEILS DE METHODE Avant toute chose, bien choisir ses mots-clés
Le Grand Robert. de la langue française VISITE GUIDÉE VERSION TEXTE
Visite guidée / Le Grand Robert de la langue française - 1 - Le Grand Robert de la langue française VISITE GUIDÉE VERSION TEXTE 1. Le Grand Robert en quelques mots 2. Déroulé de la visite guidée 3. Trouver
Au-delà de la simple gestion de votre fonds documentaire, évoluez vers la gestion complète de vos flux d informations.
Au-delà de la simple gestion de votre fonds documentaire, évoluez vers la gestion complète de vos flux d informations. SHERKAN administration BAGHEERA base documentaire KAA publication web AKELA gestion
Quel est l apport de la détection d entités nommées pour l extraction d information en domaine restreint?
Quel est l apport de la détection d entités nommées pour l extraction d information en domaine restreint? Camille Dutrey 1, 2, 3, Chloé Clavel 1, Sophie Rosset 2, Ioana Vasilescu 2, Martine Adda-Decker
THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.
École Doctorale d Informatique, Télécommunications et Électronique de Paris THÈSE présentée à TÉLÉCOM PARISTECH pour obtenir le grade de DOCTEUR de TÉLÉCOM PARISTECH Mention Informatique et Réseaux par
Proposition de sujet de thèse CIFRE EUROCOPTER / LGI2P
EUROCOPTER SAS Groupe EADS Marignane Ecole des Mines d Alès Laboratoire de Génie Informatique et d Ingénierie de Production LGI2P Nîmes Proposition de sujet de thèse CIFRE EUROCOPTER / LGI2P Titre Domaine
Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services
69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard
DIFFICULTÉS D ÉTUDIANTS À TROUVER DES ARCHÉTYPES DE MACHINES LORS D UNE RECHERCHE DANS UN HYPERTEXTE
Cinquième colloque hypermédias et apprentissages 283 DIFFICULTÉS D ÉTUDIANTS À TROUVER DES ARCHÉTYPES DE MACHINES LORS D UNE RECHERCHE DANS UN HYPERTEXTE Yves CARTONNET et Michaël HUCHETTE École Normale
Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches
Niveau C1 Descripteur global Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches La personne peut : comprendre en détail de longs discours et des échanges complexes
ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES
ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES Techniques symboliques de traitement automatique du langage pour l indexation thématique et l extraction d information temporelle Thèse Défense publique
RIHANE Abdelhamid Maitre de conférences Université de Constantine (ALGERIE) [email protected]
Pour la mise en place d une bibliothèque numérique au sein de la Faculté des Nouvelles Technologies de l Information et de la Communication à l Université de Constantine (Algérie) RIHANE Abdelhamid Maitre
LIVRE BLANC Décembre 2014
PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis
Etudier l informatique
Etudier l informatique à l Université de Genève 2015-2016 Les bonnes raisons d étudier l informatique à l UNIGE La participation à des dizaines de projets de recherche européens Dans la présente brochure,
Intelligence Inventive & Mapping des réseaux de Recherche. Expernova & Active Innovation Management GFII 5 Mars 2015
Intelligence Inventive & Mapping des réseaux de Recherche Expernova & Active Innovation Management GFII 5 Mars 2015 Identification d experts & Mapping des Réseaux de Recherche [ expernova, qui sommes nous?]
Concevoir son premier espace de cours sur la plateforme pédagogique Moodle
Concevoir son premier espace de cours sur la plateforme pédagogique Moodle Formation URFIST 19 mars 2013 Formatrice : Florie Brangé Description de la formation Nom : Concevoir son premier espace de cours
Guide et conseils généraux pour optimiser le référencement d un site internet
Guide et conseils généraux pour optimiser le référencement d un site internet Novembre 2010 1 Introduction Le référencement de votre site internet vous permet d être présent dans les différents moteurs
QlikView sur Mobile : Au-delà du reporting
QlikView sur Mobile : Au-delà du reporting Un Livre Blanc QlikView Octobre 2011 qlikview.com Table des matières QlikView sur Mobile, la solution de Business Discovery 3 La Business Discovery mobile 3 La
Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, qu ils disposent ou non d une structure de veille dédiée.
PRESENTATION QUI SOMMES-NOUS? La société VIEDOC, formée d ingénieurs expérimentés, conseille depuis 2004 les entreprises dans les domaines de la veille, de l intelligence économique et de l innovation.
1 Description générale. Résumé
Station Sensunique: une plateforme Web modulaire, collaborative et évolutive d acquisition assistée de ressources terminologiques et non terminologiques (orientée Langues Contrôlées) Izabella Thomas 1,
Gestion collaborative de documents
Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,
www.habefast.ch [email protected] Agence web en Suisse romande CH-1260 Nyon 022 362 25 70
1 By Agence web en Suisse romande 2 Qu est ce qu est le SEO? Le référencement naturel ou SEO (Search Engine Optimisation) est une pratique qui, comme son nom l indique, permet d optimiser un site web pour
Installation de Microsoft Office 2012-09-12 Version 2.1
Installation de Microsoft Office 2012-09-12 Version 2.1 TABLE DES MATIÈRES Installation de Microsoft Office... 2 Informations concernant la Pré-Installation... 2 Installation de Microsoft Office... 3 Guide
SMALL DATA DANS LA VEILLE
SMALL DATA DANS LA VEILLE Collecte et valorisation de l information stratégique dans l entreprise OCP El Jadida 25 Septembre 2014 25 Septembre 2014 OCP - El Jadida 2 Ordre du jour Définitions Etat de la
Politique d acquisition et de développement des collections de la Bibliothèque de l EPFL
VPAA/DAF/Service de l Information scientifique et des bibliothèques de l EPFL Politique d acquisition et de développement des collections de la Bibliothèque de l EPFL Table des matières PRÉAMBULE 2 1.
Service de la Gestion des Archives et de la Documentation. Direction des Ressources Humaines, des Moyens Généraux et des Systémes d information
Service de la Gestion des Archives et de la Documentation Direction des Ressources Humaines, des Moyens Généraux et des Systémes d information minestere de l habitat, de l urbanisme et de l amenagement
Réussir sa recherche d information en SHS (1ère partie) 18 mars 2015
Réussir sa recherche d information en SHS (1ère partie) 18 mars 2015 Sandra Challin et Yves Goubatian, BU Paris Descartes - Sauf mention contraire, le contenu de ce fichier est sous contrat «Creative Commons».
Installer Enterprise Miner 5.1 en SAS9.1.3 - environnement Windows
Installer Enterprise Miner 5.1 en SAS9.1.3 - environnement Windows Introduction :... 3 1. Présentation de l architecture Enterprise Miner 5.1 :... 4 2. Installation d Enterprise Miner 5.1:... 5 3. Post-installation
Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.
Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service
Position de l ASTEE sur l innovation en matière de services d eau et de déchets
Position de l ASTEE sur l innovation en matière de services d eau et de déchets Les services publics locaux de l environnement : des services discrets mais moteurs de développement Depuis leur mise en
des opportunités de succès. L A B O R ATO I R E CO N C E P T I O N D E P RO D U I T S & I N N OVAT I O N L C P I
L A B O R ATO I R E CO N C E P T I O N D E P RO D U I T S & I N N OVAT I O N L C P I Innover, c est rechercher une nouveauté utile, c est orienter son imagination vers des réalisations concrètes en utilisant
MASTER LPL : LANGUE ET INFORMATIQUE (P)
MASTER LPL : LANGUE ET INFORMATIQUE (P) RÉSUMÉ DE LA FORMATION Type de diplôme := Master Domaine : Arts, Lettres, Langues Mention : LITTERATURE, PHILOLOGIE, LINGUISTIQUE Spécialité : LANGUE ET INFORMATIQUE
7/26/2011. Analyse des besoins. Contextualisation. Univers de pensée et univers de croyance. Droit et interculturel. Les bases de connaissances
Dixième Forum international sur la déontologie et les bonnes pratiques. 19,20,21 mai 2011 Tribunal de Grande Instance de Paris Les NTIC au service de la communication interculturelle dans le domaine du
LES INDICATEURS CLÉ DE PERFORMANCE : DÉFINIR ET AGIR
Online Intelligence Solutions LES INDICATEURS CLÉ DE PERFORMANCE : DÉFINIR ET AGIR Comment intégrer les KPI à sa stratégie d entreprise? Par Jacques Warren WHITE PAPER WHITE PAPER A PROPOS DE JACQUES WARREN
Système clients serveur Kwartz Vulgarisation, identification, dossier personnel
Un peu de vulgarisation Système clients serveur Kwartz Nous allons absolument éviter les termes techniques et essayer de vulgariser au maximum. En effet, l objectif sera à terme pour les enseignants, de
Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2
éducalgo Manuel d utilisation 26 juin 2011 Table des matières 1 Tâche à effectuer : écrire un algorithme 2 2 Comment écrire un algorithme? 3 2.1 Avec quoi écrit-on? Avec les boutons d écriture........
LabCom SMILK. Social Media Intelligence and Linked Knowledge. ISTE 2013 Keynote thumb wrestling
LabCom SMILK Social Media Intelligence and Linked Knowledge ISTE 2013 Keynote thumb wrestling un lab quoi? un Laboratoire de recherche Commun (LabCom) entre un organisme de recherche et une entreprise
Hervé Couturier EVP, SAP Technology Development
Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud
En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne
Présentation du produit SAP s SAP pour les PME SAP BusinessObjects Business Intelligence, édition Edge Objectifs En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille
Introduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
