De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

Dimension: px
Commencer à balayer dès la page:

Download "De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues"

Transcription

1 De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues Maud Ehrmann Joint Research Centre Ispra, Italie. Guillaume Jacquet Xerox Research Centre Europe, Grenoble, France.

2 Contexte/historique Hier Travaux de thèse avec Bernard Victorri: Guillaume: travail sur la polysémie verbale et la calcul du sens Maud: travail sur les entités nommées, définition et désambiguïsation Aujourd hui Guillaume à XRCE: extraction d information et intégration logicielle Maud au JRC: extraction d information multilingue de la modélisation linguistique aux applications logicielles

3 Plan Entités Nommées: quoi, comment, pourquoi Traitement de l information et médias sociaux: deux exemples d application

4 Les Entités Nommées, encore et toujours Extraction d information Extraire des informations factuelles précises d un ensemble de documents homogènes pour remplir automatiquement un formulaire défini à l avance. (Conférences MUC, Grishman) Reconnaissance d entités nommées des unités textuelles particulières, «saillantes» sur le plan sémantique noms de personnes, de lieux, d organisations, dates, unités monétaires, pourcentages que l on identifie et catégorise exemple Succès rapide: en termes de performances et en termes applicatifs durable: nouveaux domaines nouvelles tâches nouveaux «corpus» Un incontournable du TAL

5 Un «objet TAL» difficile à cerner Hétérogénéité des réalisations Les EN dans le monde et le problème de la catégorisation le choix des catégories la détermination de ce qu elles recouvrent Les EN dans le texte et le problème de l annotation combinaisons de syntagmes : une ou plusieurs entités? un syntagme : quelles frontières? une entité : quelle unité lexicale? Les EN dans la langue et le problème des «polysémies» homonymie métonymie facettes Hétérogénéité des points de vue Formules définitoire sous la formes d énumération Caractérisation diverses (sens, forme) Comment définir les entités nommées?

6 Un peu de tout Le «matériau» de départ

7 Mais pas n importe quoi Proposition de définition Etant donné un modèle applicatif et un corpus, on appelle entité nommée tout expression linguistique qui réfère à une entité unique du modèle de manière autonome dans le corpus. Questions que l on s est posées: Comment définir un objet TAL? Que sont les noms propres et les descriptions définies? Que devient le cadre linguistique du sens et de la référence en TAL?

8 Considération des aspects linguistiques Etant donné un modèle applicatif et un corpus, on appelle entité nommée tout expression linguistique qui réfère à une entité unique du modèle de manière autonome dans le corpus. L ensemble EN ne se réduit pas à une catégorie linguistique Plus que les noms propres et moins que les descriptions définies Caractérisation d un comportement référentiel référence à une entité unique autonomie référentielle Barack Obama, le président des Etats-Unis, la déclaration du président La perspective linguistique ne suffit pas

9 Considération des aspects liés au TAL Etant donné un modèle applicatif et un corpus, on appelle entité nommée tout expression linguistique qui réfère à une entité unique du modèle de manière autonome dans le corpus. Caractérisation de la référence en TAL restriction représentation La référence en TAL désigne le lien qui existe entre une expression linguistique et l élément du modèle auquel elle renvoie. Articulation sens-référence en TAL entre le langage et le modèle trois mécanismes: segmentation, catégorisation et reformulation

10 Les Entités Nommées: une création TAL De la linguistique au TAL, spécification d un cadre théorique pour les EN Pas d entité nommée «en soi», seulement des critères linguistiques et un modèle. Conséquences point de vue général: explication de l hétérogénéité et de la variabilité de l ensemble entités nommées point de vue pratique: critères de décision pour l annotation point de vue méthodologique: besoin impératif d expliciter le modèle Différentes visées applicatives extraction d'information tâche d'indexation peuplement d'ontologie et/ou modélisation d'un domaine

11 Plan Entités Nommées: quoi, comment, pourquoi Traitement de l information et médias sociaux: deux exemples d application

12 Extraction d événements et médias sociaux Application générique du traitement de l information EMM au JRC système de «media monitoring», articles de presse/jour, 3600 sources, de 20 à 50 langues suivant les applications (emm.newsbrief.eu/overview.html) Projet Sync3 Exploration des médias sociaux JRC: extraction d événements et Twitter mise à jour quasi immédiate de la situation à propos de tel ou tel événement, point de vue moins traditionnel et moins "formaté" que celui des organes de presse traditionnels, nouvelles sources d'information, via les liens présents dans les tweets. Sync3

13 Détection d évènements Joint Event Detection and Entity Resolution: a virtuous cycle (M. Galle, J.M. Renders, G. Jacquet, submitted) Interaction entre détection d évènements et annotation d entités nommées: un cycle vertueux ou La construction dynamique d évènements

14 Détection d évènements Evènements: définition fondée sur les besoins des utilisateurs, les journalistes Evènements est un «fait d actualité notable» Similarité fondée sur les propriétés linguistiques de chaque segment d article (unités lexicales et entités nommées)

15 Reconnaissance d entités nommées Utilisation de l outil développé à XRCE (approche symbolique) Tendance à générer trop de référents (ex.: Gaddafi, Al-Gathafi, Khaddafi, el-qaddafi)

16 Construction dynamique d évènements Entités nommées EN1 EN4 EN6 EN2 EN3 EN5 Evènements E1 E3 E5 E2 E4

17 Détails sur les mesures de similarité Chaque entité e est représentée par un vecteur de mots w(e) ou un mot m vaut 1 si l entité e contient ce mot m. La matrice Y contient l edit-distance pondérée entre deux mots. Les poids ont été appris a partir de la ressource «JRC-Names» contenant une table d équivalence entre mots. Chaque entité est représentée par sa distribution dans les évènements. Le vecteur c(e) (de taille k, le nombre d évènements) vaut 1 pour un évènement si e apparait au moins une fois dans l un des documents de cet évènement. Si sim(ei,ej) supérieure a un seuil (cf. slide suivant), alors ei et ej sont fusionnées en une seule entité.

18 F-mesure du clustering a chaque itération en utilisant les unités lexicales et les ENs

19 Conclusion Les expressions référentielles au cœur du processus de référence au monde par l intermédiaire du langage Les entités nommées au cœur des processus TAL de compréhension des textes et de traitement de l information Encore des choses à creuser Notion de modèle, rôle des entités nommées,

20 Un grand MERCI à Bernard(s) Il neige et elle tient. Merci à vous!

21 Back up &o=date

22 Détection d évènements Evènements: définition fondée sur les besoins des utilisateurs, les journalistes Evènements est un «fait d actualité notable» Arrivée continue de nouveaux articles (150 articles/heure) Clustering Incremental Evite de refaire le clustering sur l ensemble des segments d articles Chaque nouveau segment d article est soit rattaché à un cluster existant, soit mis dans un nouveau cluster. Similarité fondée sur les propriétés linguistiques de chaque segment d article (unités lexicales et entités nommées)

23 Construction dynamique d évènements Entités nommées t t+1 t+2 EN1 EN1 EN4 EN3 EN2 EN3 EN2 EN5 temps Evènements E1 E3 E1 E3 E2 E2 E4

24 Le TAL et le Traitement de l information Objectif Trois grandes étapes (schématiques) trouver les documents comprendre leur contenu (textuel) exploiter la connaissance Une analyse partielle reconnaissance d unités textuelles saillantes typage mise en relation

Projet CNRS-Mastodons ANalyse d IMages fondée sur des Informations TEXtuelles

Projet CNRS-Mastodons ANalyse d IMages fondée sur des Informations TEXtuelles Projet CNRS-Mastodons ANalyse d IMages fondée sur des Informations TEXtuelles Bruno Crémilleux, Pierre Gançarski, Mathieu Roche, Christian Sallaberry, Maguelonne Teisseire et al. Strasbourg novembre 2014

Plus en détail

Extraction d informations

Extraction d informations Extraction d informations Reprise de slides de T. Poibeau (CNRS et U. Paris 13), de W. Cohen (CMU), de Julien Lemoine (Exalead) Antoine Rozenknop 6 février 2009 Antoine Rozenknop () Extraction d informations

Plus en détail

Table des matières. ISBN 978-2-7535-2089-9 Presses universitaires de Rennes, 2012, www.pur-editions.fr. «Traductologie pour LEA», Thomas Lenzen

Table des matières. ISBN 978-2-7535-2089-9 Presses universitaires de Rennes, 2012, www.pur-editions.fr. «Traductologie pour LEA», Thomas Lenzen Avant-propos... 9 Chapitre 1 La discipline traductologique ; son importance pour la filière LEA... 11 Réflexions sur la traduction avant la constitution d une discipline traductologique... 11 Les apports

Plus en détail

Les outils de veille sur Internet Panorama, évolutions, nouveautés. Myriel Brouland SCIP France -10 Mai 2006

Les outils de veille sur Internet Panorama, évolutions, nouveautés. Myriel Brouland SCIP France -10 Mai 2006 Les outils de veille sur Internet Panorama, évolutions, nouveautés Myriel Brouland SCIP France -10 Mai 2006 1 La veille en France: une situation paradoxale Une situation contrastée Une prise de conscience

Plus en détail

Indexation conceptuelle application au domaine biomédical. Mesures de similarité dans les ontologies. [Séminaire MIAD Montpellier SupAgro]

Indexation conceptuelle application au domaine biomédical. Mesures de similarité dans les ontologies. [Séminaire MIAD Montpellier SupAgro] [] Indexation conceptuelle application au domaine biomédical Mesures de similarité dans les ontologies Sylvie Ranwez Sébastien Harispe LGI2P de l école des mines d Alès équipe KID (Knowledge and Image

Plus en détail

Présentation de la plateforme d analyse linguistique médiévale

Présentation de la plateforme d analyse linguistique médiévale Présentation de la plateforme d analyse linguistique médiévale 1. Introduction Tout au long de ce document, notre projet sera présenté à travers la méthodologie suivie pour développer la plateforme d analyse

Plus en détail

Les entités nommées : éléments pour la conceptualisation

Les entités nommées : éléments pour la conceptualisation Les entités nommées : éléments pour la conceptualisation Nouha Omrane 1, Adeline Nazarenko 1, Sylvie Szulman 1 LIPN CNRS-UMR 7030, 99 avenue Jean-Baptiste Clément, 93430 Villetaneuse prenom.nom@lipn.univ-paris13.fr

Plus en détail

Construction et enrichissement automatique d ontologie à partir de ressources externes

Construction et enrichissement automatique d ontologie à partir de ressources externes Construction et enrichissement automatique d ontologie à partir de ressources externes JFO 2009 Jeudi 3 décembre 2009 E. Kergosien (LIUPPA, Pau) M. Kamel (IRIT- UPS, Toulouse) M. Sallabery (LIUPPA, Pau)

Plus en détail

Un cycle de modélisation comme méthodologie supportant l élaboration d un construit théorique en recherche en éducation

Un cycle de modélisation comme méthodologie supportant l élaboration d un construit théorique en recherche en éducation Un cycle de modélisation comme méthodologie supportant l élaboration d un construit théorique en recherche en éducation Une valeur ajoutée à l anasynthèse Nicole Landry, Ph.D. Réjean Auger, Ph.D. TELUQ,

Plus en détail

Séminaire DIXIT - Les nouvelles frontières de la «data intelligence» : content analytics, machine-learning, prédictif

Séminaire DIXIT - Les nouvelles frontières de la «data intelligence» : content analytics, machine-learning, prédictif Séminaire DIXIT - Les nouvelles frontières de la «data intelligence» : content analytics, machine-learning, prédictif 13 avril 2015 LES INNOVATIONS DANS LA SOCIAL MEDIA INTELLIGENCE Expérience informationnelle

Plus en détail

Du texte brut au web sémantique

Du texte brut au web sémantique Du texte brut au web sémantique Thierry Poibeau LIPN, CNRS et Université Paris 13 Faciliter l accès au texte But : Améliorer l accès à l information (essentiellement textuelle) Moyen : Proposer de nouveaux

Plus en détail

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations U Université dumaine Faculté des Lettres, Langues et Sciences humaines Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations Carole Lailler 1 L interrogation : une modalité

Plus en détail

Des indices sur la fiabilité des sorties ou comment un analyseur robuste pourrait s auto-évaluer.

Des indices sur la fiabilité des sorties ou comment un analyseur robuste pourrait s auto-évaluer. Des indices sur la fiabilité des sorties ou comment un analyseur robuste pourrait s auto-évaluer. Nuria Gala GETA-CLIPS-IMAG 385 av. de la Bibliothèque, BP 53 F-38041 Grenoble cedex 9, France nuria.gala@imag.fr

Plus en détail

P. 1. Evolution de l environnement et des compétences documentaires: exemple dans le champ de la santé publique

P. 1. Evolution de l environnement et des compétences documentaires: exemple dans le champ de la santé publique P. 1 Evolution de l environnement et des compétences documentaires: exemple dans le champ de la santé publique Début des années 1990 L Inist-CNRS va contribuer à l alimentation du premier corpus de la

Plus en détail

Informations de l'unité d'enseignement Implantation. Cursus de. Intitulé. Code. Cycle 1. Bloc 2. Quadrimestre 2. Pondération 4. Nombre de crédits 4

Informations de l'unité d'enseignement Implantation. Cursus de. Intitulé. Code. Cycle 1. Bloc 2. Quadrimestre 2. Pondération 4. Nombre de crédits 4 Informations de l'unité d'enseignement Implantation Cursus de Intitulé Code Institut Paul Lambin Bachelier en informatique de gestion Programmation Avancée en Java I2020 Cycle 1 Bloc 2 Quadrimestre 2 Pondération

Plus en détail

Le poids des entités nommées dans le filtrage des termes d un domaine

Le poids des entités nommées dans le filtrage des termes d un domaine Le poids des entités nommées dans le filtrage des termes d un domaine Nouha Omrane Adeline Nazarenko Sylvie Szulman LIPN UMR 7030 (Université Paris 13 & CNRS) 99, av. J.B. Clément, 93430, Villetaneuse

Plus en détail

Évaluer les liens entre codage et les données structurées (variables) Introduction au gestionnaire de rapport et au journal de commandes

Évaluer les liens entre codage et les données structurées (variables) Introduction au gestionnaire de rapport et au journal de commandes Trois approches en analyse de texte L'Analyse Qualitative L'analyse de Contenu Quantitative (par dictionnaires) Le forage de texte ("Text Mining") Introduction aux logiciels de Provalis Research QDA Miner

Plus en détail

Plan d Evaluation (phase 1) Version 1.1

Plan d Evaluation (phase 1) Version 1.1 Evaluation des Systèmes de Transcription enrichie d Emissions Radiophoniques (ESTER) Plan d Evaluation (phase 1) Version 1.1 Dernière mise à jour le 21 novembre 2003. 1 Préambule Ce document décrit le

Plus en détail

Le dictionnaire DEM dans NooJ

Le dictionnaire DEM dans NooJ 21 ème Traitement Automatique des Langues Naturelles, Marseille, 2014 Le dictionnaire DEM dans NooJ Max Silberztein ELLIADD, Université de Franche-Comté, 30 rue Mégevand, 25000 Besançon max.silberztein@univ-fcomte.fr

Plus en détail

Introduction au TALN et à l ingénierie linguistique. Isabelle Tellier ILPGA

Introduction au TALN et à l ingénierie linguistique. Isabelle Tellier ILPGA Introduction au TALN et à l ingénierie linguistique Isabelle Tellier ILPGA Plan de l exposé 1. Quelques notions de sciences du langage 2. Applications et enjeux du TAL/ingénierie linguistique 3. Les deux

Plus en détail

Analyse de contenu & big data Un état de l art des applications de la sémantique en 2013

Analyse de contenu & big data Un état de l art des applications de la sémantique en 2013 Analyse de contenu & big data Un état de l art des applications de la sémantique en 2013 Sommaire 1. Editorial de F.R. Chaumartin, fondateur de Proxem (page 2) 2. Moteur de recherche sémantique (page 3)

Plus en détail

L analyse de l information proposée par les outils de veille

L analyse de l information proposée par les outils de veille L analyse de l information proposée par les outils de veille Claire François To cite this version: Claire François. L analyse de l information proposée par les outils de veille. Regards sur l IE : le magazine

Plus en détail

De l importance de l homogénéisation des conventions de transcription pour l alignement automatique de corpus oraux de parole spontanée

De l importance de l homogénéisation des conventions de transcription pour l alignement automatique de corpus oraux de parole spontanée De l importance de l homogénéisation des conventions de transcription pour l alignement automatique de corpus oraux de parole spontanée Dominique Fohr, Odile Mella, Denis Jouvet LORIA INRIA Nancy France

Plus en détail

Caractérisation d'une situation communicative particulière :

Caractérisation d'une situation communicative particulière : Caractérisation d'une situation communicative particulière : la discussion à visée philosophique. Aline Auriel, Université Blaise Pascal, LRL. INTRODUCTION La discussion à visée philosophique (DVP) est

Plus en détail

MASTER LPL : LANGUE ET INFORMATIQUE (P)

MASTER LPL : LANGUE ET INFORMATIQUE (P) MASTER LPL : LANGUE ET INFORMATIQUE (P) RÉSUMÉ DE LA FORMATION Type de diplôme := Master Domaine : Arts, Lettres, Langues Mention : LITTERATURE, PHILOLOGIE, LINGUISTIQUE Spécialité : LANGUE ET INFORMATIQUE

Plus en détail

Sous-graphes de cooccurrences pour la détection de thématiques dans un corpus de taille moyenne

Sous-graphes de cooccurrences pour la détection de thématiques dans un corpus de taille moyenne Sous-graphes de cooccurrences pour la détection de thématiques dans un corpus de taille moyenne Aurélien Lauf* ** * ERTIM 1 (Équipe de Recherche en Textes, Informatique, Multilinguisme) INALCO - 49bis

Plus en détail

DÉFINITION DU DOMAINE D ÉVALUATION POUR LA SANCTION ET LA RECONNAISSANCE. Cours Arithmétique appliquée aux finances personnelles MAT-P101-4

DÉFINITION DU DOMAINE D ÉVALUATION POUR LA SANCTION ET LA RECONNAISSANCE. Cours Arithmétique appliquée aux finances personnelles MAT-P101-4 DÉFINITION DU DOMAINE D ÉVALUATION POUR LA SANCTION ET LA RECONNAISSANCE Cours Arithmétique appliquée aux finances personnelles MAT-P101-4 Programme d études de la formation de base commune Mathématique

Plus en détail

La Veille multilingue : outils et ressources pour les traducteurs. Jean-Paul PINTE Institut Catholique de Lille

La Veille multilingue : outils et ressources pour les traducteurs. Jean-Paul PINTE Institut Catholique de Lille La Veille multilingue : outils et ressources pour les traducteurs Jean-Paul PINTE Institut Catholique de Lille Premier Colloque International sur la veille multilingue Genève les 28 et 29 mai 2008 Nous

Plus en détail

Analyse sémiotique des sites web.

Analyse sémiotique des sites web. Analyse sémiotique des sites web. Description, Evaluation et Conception Le cas des sites de la presse écrite Peter Stockinger Maison des Sciences de l Homme (MSH) Equipe Sémiotique Cognitive et Nouveaux

Plus en détail

Formation et recherche dans le domaine du traitement automatique des langues en contexte universitaire

Formation et recherche dans le domaine du traitement automatique des langues en contexte universitaire Formation et recherche dans le domaine du traitement automatique des langues en contexte universitaire Dans cette intervention, nous nous pencherons sur le rôle spécifique que jouent ou que peuvent jouer

Plus en détail

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

Quel est l apport de la détection d entités nommées pour l extraction d information en domaine restreint?

Quel est l apport de la détection d entités nommées pour l extraction d information en domaine restreint? Quel est l apport de la détection d entités nommées pour l extraction d information en domaine restreint? Camille Dutrey 1, 2, 3, Chloé Clavel 1, Sophie Rosset 2, Ioana Vasilescu 2, Martine Adda-Decker

Plus en détail

La vérité sur la tonalité & l analyse automatique du langage

La vérité sur la tonalité & l analyse automatique du langage La vérité sur la tonalité & l analyse automatique du langage Réalisé par Synthesio Sommaire Introduction.2 Pas d intelligence artificielle pour l analyse des sentiments.3 L analyse humaine, un passage

Plus en détail

Analyse des réseaux sociaux et apprentissage

Analyse des réseaux sociaux et apprentissage Analyse des réseaux sociaux et apprentissage Emmanuel Viennet Laboratoire de Traitement et Transport de l Information Université Paris 13 - Sorbonne Paris Cité Réseaux sociaux? Réseaux sociaux? Analyse

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

De 2 à 22 millions d'images; Création, Indexation et Recherche par le contenu avec Piria

De 2 à 22 millions d'images; Création, Indexation et Recherche par le contenu avec Piria De 2 à 22 millions d'images; Création, Indexation et Recherche par le contenu avec Piria contact : patrick.hede@cea.fr Commissariat à l'energie Atomique List sensorielles 13/05/07 1 Plan Le CEA, le Lic2m

Plus en détail

Ressources lexicales au service de recherche et d indexation des images

Ressources lexicales au service de recherche et d indexation des images RECITAL 2011, Montpellier, 27 juin - 1er juillet 2011 Ressources lexicales au service de recherche et d indexation des images Inga Gheorghita 1,2 (1) ATILF-CNRS, Nancy-Université (UMR 7118), France (2)

Plus en détail

Recherche d informations et veille marketing. Beth Krasna 17.10.2003. What you mean is what you get.

Recherche d informations et veille marketing. Beth Krasna 17.10.2003. What you mean is what you get. Recherche d informations et veille marketing Beth Krasna 17.10.2003. Le Cycle de Connaissance KM Adapter Organiser Utiliser Collaboration Publier Analyser Collecter MI Données Information Connaissance

Plus en détail

Un document APROGED avec les contributions de : Ever Team, IBM, Intellique, Novadys, Normier, Banctec, Proxem, Magillem

Un document APROGED avec les contributions de : Ever Team, IBM, Intellique, Novadys, Normier, Banctec, Proxem, Magillem Un document APROGED avec les contributions de : Ever Team, IBM, Intellique, Novadys, Normier, Banctec, Proxem, Magillem Groupe de travail piloté par Ever-Team 04 / 2013 Toujours plus de contenu Croissance

Plus en détail

Un outil de géolocalisation et de résumé automatique pour faciliter l accès à l information dans des corpus d actualité

Un outil de géolocalisation et de résumé automatique pour faciliter l accès à l information dans des corpus d actualité Un outil de géolocalisation et de résumé automatique pour faciliter l accès à l information dans des corpus d actualité Journée Résumé Automatique Multimédia 2011/03/17 Emilie Guimier De Neef Plan de la

Plus en détail

Mineure Architectures Orientées Services SOA Business Process Modeling (BPM) Mineure SOA. Business Process Modeling (BPM)

Mineure Architectures Orientées Services SOA Business Process Modeling (BPM) Mineure SOA. Business Process Modeling (BPM) Mineure SOA Business Process Modeling (BPM) Idir AIT SADOUNE idir.aitsadoune@supelec.fr Idir AIT SADOUNE - Plan 1 Notion de processus? 2 Modélisation des processus? 3 Langages

Plus en détail

TRAVAUX DE RECHERCHE DANS LE

TRAVAUX DE RECHERCHE DANS LE TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT

Plus en détail

SMILK : du TAL au LOD

SMILK : du TAL au LOD SMILK : du TAL au LOD Social Media Intelligence and Linked Knowledge Cédric Lopez (Viseo R&D) 2,060 milliards d inscrits sur les réseaux sociaux Une personne passe en moyenne 4,8 heures par jour devant

Plus en détail

Business Process Modeling (BPM)

Business Process Modeling (BPM) Business Process Modeling (BPM) Mineure SOA Cécile Hardebolle cecile.hardebolle@supelec.fr Programme 8 nov. 15 nov. Introduction. Enjeux, rôle de l'architecte SI Partie n 1 du cas d'étude Architecture

Plus en détail

PARCOURS DISCIPLINAIRES option Traitement Automatique des Langues PREMIERE ANNEE

PARCOURS DISCIPLINAIRES option Traitement Automatique des Langues PREMIERE ANNEE PARCOURS DISCIPLINAIRES option Traitement Automatique des Langues PREMIERE ANNEE SEMESTRE 1 JGUA200 : Initiation au Traitement Automatique des Langues (36h) resp. I. Thomas - Traitement Automatique des

Plus en détail

Analyse conjointe du signal sonore et de sa transcription pour l identification nommée de locuteurs

Analyse conjointe du signal sonore et de sa transcription pour l identification nommée de locuteurs Analyse conjointe du signal sonore et de sa transcription pour l identification nommée de locuteurs Vincent Jousse Sylvain Meignier Christine Jacquin Simon Petitrenaud Yannick Estève Béatrice Daille LIUM

Plus en détail

INGÉNIERIE DES CONNAISSANCES BCT (3b)

INGÉNIERIE DES CONNAISSANCES BCT (3b) 08.12.1999 INGÉNIERIE DES CONNAISSANCES BCT (3b) Nathalie Aussenac-Gilles (IRIT) Jean Charlet (DSI/AP-HP) Ingénierie des connaissances BCT (N. Aussenac-Gilles, J. Charlet) BCT-1 PLAN La notion de BCT :

Plus en détail

ACOLAD Plateforme pour l édition collaborative dépendancielle

ACOLAD Plateforme pour l édition collaborative dépendancielle ACOLAD Plateforme pour l édition collaborative dépendancielle Francis Brunet-Manquat et Jérôme Goulian LIG-GETALP, Université Pierre Mendès France Grenoble 2 Francis.Brunet-Manquat@imag.fr et Jerome.Goulian@imag.fr

Plus en détail

PROPOSITION D UNE APPROCHE DE SEGMENTATION D IMAGES HYPERSPECTRALES

PROPOSITION D UNE APPROCHE DE SEGMENTATION D IMAGES HYPERSPECTRALES PROPOSITION D UNE APPROCHE DE SEGMENTATION D IMAGES HYPERSPECTRALES Nathalie GORRETTA MONTEIRO 1 1 UMR Information et Technologies pour les Agro-Procédés, Cemagref Montpellier, France Présentée le 25 Février

Plus en détail

Compte-rendu de Hamma B., La préposition en français

Compte-rendu de Hamma B., La préposition en français Compte-rendu de Hamma B., La préposition en français Badreddine Hamma To cite this version: Badreddine Hamma. Compte-rendu de Hamma B., La préposition en français. Revue française de linguistique appliquée,

Plus en détail

Construire une Documentation Structurée des Dépendances et des Services (DSDS) Rafael Diaz Maurin, CRU JRES, Nantes, le 2 décembre 2009

Construire une Documentation Structurée des Dépendances et des Services (DSDS) Rafael Diaz Maurin, CRU JRES, Nantes, le 2 décembre 2009 Construire une Documentation Structurée des Dépendances et des Services (DSDS) Rafael Diaz Maurin, CRU 1 Agenda Introduction : qu'est-ce qu'une DSDS? Les ontologies : outils pour la DSDS Protégé : éditeur

Plus en détail

Des traitements aux ressources linguistiques : le rôle d une architecture linguistique

Des traitements aux ressources linguistiques : le rôle d une architecture linguistique Des traitements aux ressources : le rôle d une architecture Frederik Cailliau Villetaneuse, le 9 décembre 2010 Sous la direction d Adeline Nazarenko 1. 2. 3. 4. 5. 6. 2 Sinequa Cifre à Sinequa Recherche

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Méthode d extraction des signaux faibles

Méthode d extraction des signaux faibles Méthode d extraction des signaux faibles Cristelle ROUX GFI Bénélux, Luxembourg cristelle.roux@gfi.be 1. Introduction Au début d une analyse stratégique, la première question posée est très souvent la

Plus en détail

Fouille de données et sémantique : des techniques pour donner du sens aux données

Fouille de données et sémantique : des techniques pour donner du sens aux données Fouille de données et sémantique : des techniques pour donner du sens aux données Nathalie Aussenac-Gilles (IRIT) co-animatrice avec M. Boughanem de l axe masse de données et calcul http://www.irit.fr/-masses-de-donnees-et-calcul,677-?lang=fr

Plus en détail

Nouvelles de l AS fouille d images. Émergence de caractéristiques sémantiques

Nouvelles de l AS fouille d images. Émergence de caractéristiques sémantiques Nouvelles de l AS fouille d images Émergence de caractéristiques sémantiques Patrick GROS Projet TEXMEX IRISA - UMR 6074, CNRS, université de Rennes 1, INSA Rennes, INRIA L AS fouille d images Qu est-ce

Plus en détail

Évaluation de la classification et segmentation d'images en environnement incertain

Évaluation de la classification et segmentation d'images en environnement incertain Évaluation de la classification et segmentation d'images en environnement incertain EXTRACTION ET EXPLOITATION DE L INFORMATION EN ENVIRONNEMENTS INCERTAINS / E3I2 EA3876 2, rue F. Verny 29806 Brest cedex

Plus en détail

Classification d entités nommées de type «film»

Classification d entités nommées de type «film» 22 ème Traitement Automatique des Langues Naturelles, Caen, 2015 Classification d entités nommées de type «film» Olivier Collin Aleksandra Guerraz Orange Labs 2, avenue Pierre Marzin, 22307 Lannion Cedex,

Plus en détail

Atelier «Très Haute Résolution Spatiale» Outils pour la reconnaissance des formes

Atelier «Très Haute Résolution Spatiale» Outils pour la reconnaissance des formes CNES Paris - 22/05/2003 Atelier «Très Haute Résolution Spatiale» Outils pour la reconnaissance des formes Michel DHOME LASMEA UMR 6602CNRS/UBP Clermont-Ferrand Etat de l art (communauté vision artificielle)

Plus en détail

ANALYSE DES DOCUMENTS TEXTE POUR LA SURVEILLANCE ET LA VEILLE TECHNOLOGIQUE EN TELECOMMUNICATION

ANALYSE DES DOCUMENTS TEXTE POUR LA SURVEILLANCE ET LA VEILLE TECHNOLOGIQUE EN TELECOMMUNICATION ANALYSE DES DOCUMENTS TEXTE POUR LA SURVEILLANCE ET LA VEILLE TECHNOLOGIQUE EN TELECOMMUNICATION Hamid MACHHOUR (*), Ismail KASSOU (*), Khalid EL HIMDI (**), Ilham BERRADA (*) hamid.machhour@gmail.com,

Plus en détail

EVOLUTIONS EXOGENES. REVER S.A. Belgique Tél : +32 71 20 71 61 http://www.rever.eu

EVOLUTIONS EXOGENES. REVER S.A. Belgique Tél : +32 71 20 71 61 http://www.rever.eu EVOLUTIONS EXOGENES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas être considérés comme un engagement

Plus en détail

La détection automatique de l opinion : contraintes et enjeux

La détection automatique de l opinion : contraintes et enjeux La détection automatique de l opinion : contraintes et enjeux Frédéric Marcoul Responsable R&D de Spotter fmarcoul@spotter.com Ana Athayde Président Directeur Général de Spotter aathayde@spotter.com RÉSUMÉ

Plus en détail

N 334 - SIMON Anne-Catherine

N 334 - SIMON Anne-Catherine N 334 - SIMON Anne-Catherine RÉALISATION D UN CDROM/DVD CONTENANT DES DONNÉES DU LANGAGE ORAL ORGANISÉES EN PARCOURS DIDACTIQUES D INITIATION LINGUISTIQUE A PARTIR DES BASES DE DONNÉES VALIBEL Introduction

Plus en détail

Combinaison d approches pour l extraction automatique d événements

Combinaison d approches pour l extraction automatique d événements Combinaison d approches pour l extraction automatique d événements Laurie Serrano 1, 2 Thierry Charnois 1 Stephan Brunessaux 2 Bruno Grilheres 2 Maroua Bouzid 1 (1) Laboratoire GREYC, Université de Caen

Plus en détail

Formation BusinessObjects v.6.5. Contenu des Formations

Formation BusinessObjects v.6.5. Contenu des Formations Formation BusinessObjects v.6.5 des Formations TABLE DES MATIERES I. UTILISATEUR BO V.6.5 NIVEAU 1 & 2... 3 DESCRIPTION... 3 PREALABLE... 3 CONTENU... 3 II. INFOVIEW & WEBINTELLIGENCE V.6.5... 4 DESCRIPTION...

Plus en détail

Comment utiliser cet outil?

Comment utiliser cet outil? Comment utiliser cet outil? Cette aide vous permet à la fois de découvrir les ressources disponibles et de comprendre comment les exploiter au mieux. Fichier à imprimer (6 pages) ou à laisser ouvert pour

Plus en détail

ANNEXE 6. Veuillez demander la version word au Ministère NOM DU SECTEUR DE FORMATION NOM DU PROGRAMME PROJET DE FORMATION DATE - ANNÉE

ANNEXE 6. Veuillez demander la version word au Ministère NOM DU SECTEUR DE FORMATION NOM DU PROGRAMME PROJET DE FORMATION DATE - ANNÉE ANNEXE 6 Veuillez demander la version word au Ministère NOM DU SECTEUR DE FORMATION NOM DU PROGRAMME PROJET DE FORMATION DATE - ANNÉE ÉQUIPE DE PRODUCTION Responsabilité et coordination Nom Titre Organisation

Plus en détail

Master 2 Informatique UAG. Classification de documents/textes

Master 2 Informatique UAG. Classification de documents/textes Data Mining Master 2 Informatique UAG Classification de documents/textes Utilisée en text mining, information retrieval : amélioration du recall et de la précision Moyen de trouver les voisins les plus

Plus en détail

Système D Indexation et de Recherche d Images par le contenu

Système D Indexation et de Recherche d Images par le contenu Système D Indexation et de Recherche d Images par le contenu 1 Houaria ABED, 1 Lynda ZAOUI Laboratoire : Systèmes, Signaux, Données Département Informatique, Faculté des Sciences Université des Sciences

Plus en détail

Corpus de textes écrits et oraux

Corpus de textes écrits et oraux Plan d accès Université de Mons Campus Plaine de Nimy Avenue du Champs de Mars à 7000 Mons Bâtiment FTI-EII - salle polyvalente Le Service Cultures & Médiations linguistiques (FTI-EII) propose une journée

Plus en détail

LA RÉSOLUTION DE PROBLÈME

LA RÉSOLUTION DE PROBLÈME 1 LA RÉSOLUTION DE PROBLÈME CYCLES 2 ET 3 Circonscription de Grenoble 4 Evelyne TOUCHARD conseillère pédagogique Mots clé Démarche d enseignement - catégories de problèmes (typologie)- problème du jour-

Plus en détail

Prototypes et k plus proches voisins (kppv (knn))

Prototypes et k plus proches voisins (kppv (knn)) Prototypes et k plus proches voisins (kppv (knn)) Université Grenoble 1 - Lab. Informatique Grenbole / MRIM Learning Vector Quantization (1) Algorithme en ligne (on-line) dans lequel des prototypes sont

Plus en détail

ZIMINA-POIROT Maria (SYLED - ILPGA, Sorbonne nouvelle Paris 3) zimina@msh-paris.fr

ZIMINA-POIROT Maria (SYLED - ILPGA, Sorbonne nouvelle Paris 3) zimina@msh-paris.fr Thème : Corpus multilingues et alignements textométriques TP «Analyse de corpus de textes juridiques (français/anglais) à l aide d outils de statistique textuelle Lexico3». Ressources : le corpus TRAD_JUR

Plus en détail

DIFFERENCIER EN FONCTION DES NIVEAUX. Domaine Typologie des différences Fonctions Modalités Volume Nature (support/document) Thème

DIFFERENCIER EN FONCTION DES NIVEAUX. Domaine Typologie des différences Fonctions Modalités Volume Nature (support/document) Thème contenus DIFFERENCIER EN FONCTION DES NIVEAUX Domaine Typologie des différences Fonctions Modalités Volume Nature (support/document) Thème Prendre en compte niveau des élèves motivation des élèves besoins

Plus en détail

Noureddine Kerzazi noureddine.kerzazi@polymtl.ca

Noureddine Kerzazi noureddine.kerzazi@polymtl.ca Domaine de la modélisation des processus pour le génie logiciel. Noureddine Kerzazi noureddine.kerzazi@polymtl.ca DSL4SPM Domain-Specific-Language for Software Process Modeling Il s agit d un nouveau cadre

Plus en détail

Analyse et conception d un modèle de qualité logicielle

Analyse et conception d un modèle de qualité logicielle Analyse et conception d un modèle de qualité logicielle Karine Mordal Thèse dirigée par Françoise Balmas Laboratoire LIASD, Université Paris 8 3 Décembre 2012 Les projets de recherche Le contexte Le projet

Plus en détail

MAITRISE DU LANGAGE ET DE LA LANGUE FRANCAISE au cycle 2 (programmes 2007)

MAITRISE DU LANGAGE ET DE LA LANGUE FRANCAISE au cycle 2 (programmes 2007) MAITRISE DU LANGAGE ET DE LA LANGUE FRANCAISE au cycle 2 (programmes 2007) Ces tableaux reprennent les compétences des programmes 2007. Ils servent de référentiel commun à tous les enseignants du cycle

Plus en détail

ProxiDocs : un outil de cartographie et de catégorisation thématique de corpus

ProxiDocs : un outil de cartographie et de catégorisation thématique de corpus ProxiDocs : un outil de cartographie et de catégorisation thématique de corpus Thibault ROY 1 et Pierre BEUST 1 1 GREYC- ISLanD CNRS UMR 6072 Université de Caen 14032 Caen Cedex France thibault.roy@etu.info.unicaen.fr,

Plus en détail

Formation Méthode MDM. Architecture et procédés de modélisation des données de référence

Formation Méthode MDM. Architecture et procédés de modélisation des données de référence Architecture et procédés de modélisation des données de référence Objectifs de la session Les participants découvrent l architecture et les procédés de modélisation utilisés pour les projets de Master

Plus en détail

Aide à la rédaction du contenu

Aide à la rédaction du contenu Aide à la rédaction du contenu Table des matières Présentation d un site vitrine... 2 Le contenu de ce type de site Internet... 2 Quelles pages pour un site vitrine?... 2 La page d accueil :... 2 La page

Plus en détail

Sources d information : lexicale. Sources d information : phonotactique. Sources d information : prosodie (2/3) Sources d information : prosodie (1/3)

Sources d information : lexicale. Sources d information : phonotactique. Sources d information : prosodie (2/3) Sources d information : prosodie (1/3) Organisation de la présentation Reconnaissance automatique des langues RMITS 28 http://www.irit.fr/~jerome.farinas/rmits28/ Jérôme Farinas jerome.farinas@irit.fr Équipe SAMOVA (Structuration, Analyse et

Plus en détail

Maintien des personnes âgées à domicile

Maintien des personnes âgées à domicile Maintien des personnes âgées à domicile Enjeux scientifiques et technologiques liés à la vision par ordinateur Christian Wolf http://liris.cnrs.fr/christian.wolf Introduction Sommaire Les données et les

Plus en détail

Approches pour l extraction de connaissances à partir de textes et de ressources structurées

Approches pour l extraction de connaissances à partir de textes et de ressources structurées Approches pour l extraction de connaissances à partir de textes et de ressources structurées Cours DECOL - M2 - ECA E. Kergosien (IRSTEA - LIRMM ) eric.kergosien@lirmm.fr UM2 2012-2013 1 Introduction :

Plus en détail

Business Intelligence

Business Intelligence avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................

Plus en détail

1) Pourquoi un protocole :

1) Pourquoi un protocole : Protocole d une pratique de catégorisation contributive autour du cours de philosophie de pharmakon.fr 1) Pourquoi un protocole : Lors de la première séance de la quatrième année du cours de pharmakon.fr,

Plus en détail

Qu est-ce que rédiger?! Hayes & Flower, 1981; Alamargot & Chanquoy, 2001;! Fayol, 1997; 2013; Garcia-Debanc, 1990! Une conception simple!

Qu est-ce que rédiger?! Hayes & Flower, 1981; Alamargot & Chanquoy, 2001;! Fayol, 1997; 2013; Garcia-Debanc, 1990! Une conception simple! Difficultés de la production verbale écrite " Approche cognitive Michel Fayol Université de Clermont Blaise Pascal et CNRS Michel.fayol@univ-bpclermont.fr Qu est-ce que rédiger? Hayes & Flower, 1981; Alamargot

Plus en détail

Catalogue des formations Edition 2015

Catalogue des formations Edition 2015 Antidot - Formations Catalogue des formations Edition 2015 : catalogue_formation_2015 Révision du 06.01.2015 Sommaire!!"##$%&'( )! $*$+,(-'(."##'+.'&( /!,'.0+"1"2%'( /!!."3'( /! $(3&"3"!(-4(5(.$,$1"24'(-'!(6"&#$,%"+!(7('-%,%"+()89:(;(

Plus en détail

Université de Bangui. Modélisons en UML

Université de Bangui. Modélisons en UML Université de Bangui CRM Modélisons en UML Ce cours a été possible grâce à l initiative d Apollinaire MOLAYE qui m a contacté pour vous faire bénéficier de mes connaissances en nouvelles technologies et

Plus en détail

TABLE DES MATIÈRES DOSSIER MODÈLE MISSION D EXAMEN

TABLE DES MATIÈRES DOSSIER MODÈLE MISSION D EXAMEN INTRODUCTION 1 Présentation du dossier modèle... 1 2. Fonctionnement du dossier modèle... 3 2.1 Questionnaires de l ICCA... 3 2.2 Feuilles de travail... 3 2.3 Conclusion... 5 Annexe 1 Aperçu des changements

Plus en détail

Déclassement d'actifs et stock brut de capital

Déclassement d'actifs et stock brut de capital Extrait de : La mesure du capital - Manuel de l'ocde 2009 Deuxième édition Accéder à cette publication : http://dx.doi.org/10.1787/9789264067752-fr Déclassement d'actifs et stock brut de capital Merci

Plus en détail

Détection, visualisation et validation d évènements médiatiques. INA/LaBRI - Benjamin Renoust EGC 20/06/11

Détection, visualisation et validation d évènements médiatiques. INA/LaBRI - Benjamin Renoust EGC 20/06/11 Interface d'exploration et de manipulation pour la détection d'évènements médiatiques Contrainte : Mettre l'utilisateur au centre du système Objectifs : Produire des cartes visuelles Retour sur la qualité

Plus en détail

Le CRM en BFI : une approche du pilotage stratégique

Le CRM en BFI : une approche du pilotage stratégique Le CRM en BFI : une approche du pilotage stratégique Sébastien Pasquet, Responsable de missions Le CRM (Customer Relationship Management) s est développé depuis 10 ans essentiellement par l intégration

Plus en détail

Profil du candidat et connaissances techniques à connaître/maîtriser

Profil du candidat et connaissances techniques à connaître/maîtriser Utilisation d algorithmes de deep learning pour la reconnaissance d iris. jonathan.milgram@morpho.com Dans ce cadre, l'unité de recherche et technologie a pour but de maintenir le leadership Au sein de

Plus en détail

Le langage à l'école maternelle IEN SAINT-PIERRE 2 ANIMATION PEDAGOGIQUE 2012-2013

Le langage à l'école maternelle IEN SAINT-PIERRE 2 ANIMATION PEDAGOGIQUE 2012-2013 Le langage à l'école maternelle PEDAGOGIQUE 2012-2013 S APPUYER SUR LES DIFFÉRENTS SUBSTITUTS. POUR DÉVELOPPER LES COMPÉTENCES LANGAGIÈRES Le support d images, de dessins, de photographies, de représentations

Plus en détail

Méthodes et outils pour l annotation manuelle ou semi-automatique de corpus

Méthodes et outils pour l annotation manuelle ou semi-automatique de corpus Méthodes et outils pour l annotation manuelle ou semi-automatique de corpus Yann Mathet, Antoine Widlöcher Laboratoire GREYC - Université de Caen Ecole thématique «Annotation de données langagières» Biarritz,

Plus en détail

TABLE DES MATIERES (les numéros renvoient aux pages)

TABLE DES MATIERES (les numéros renvoient aux pages) TABLE DES MATIERES (les numéros renvoient aux pages) Table des abréviations... 7 Introduction... 11 Partie I - L enregistrement des noms de domaine... 31 Titre 1 Ŕ L existence de domaines de premier niveau,

Plus en détail

MARQUEUR, UN LOGICIEL DE MARQUAGE SEMI-AUTOMATIQUE DE TEXTES

MARQUEUR, UN LOGICIEL DE MARQUAGE SEMI-AUTOMATIQUE DE TEXTES MARQUEUR, UN LOGICIEL DE MARQUAGE SEMI-AUTOMATIQUE DE TEXTES 1 Abdelkrim Mokhtari Département de Langue et de Littérature Françaises Université Ibn Tofail Faculté des Lettres et des Sciences Humaines Kénitra,

Plus en détail

Traitement Automatique des Langues pour les Systèmes d'information. Introduction. Damien Nouvel Nathalie Friburger Jean-Yves Antoine

Traitement Automatique des Langues pour les Systèmes d'information. Introduction. Damien Nouvel Nathalie Friburger Jean-Yves Antoine Langues pour les Systèmes d'information Introduction Nathalie Friburger Jean-Yves Antoine Organisation du cours Introduction : 1h cours (D. Nouvel) Morphologie, terminologie et lexiques : 3h cours, 2h

Plus en détail

TRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie

TRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie TRAITEMENT AUTOMATIQUE DES LANGUES Licence d'informatique 2ème Année Semestre 1 Département d'informatique Université de Caen Basse-Normandie https://dias.users.greyc.fr/?op=paginas/tal.html Plan Définition

Plus en détail

Fouille de données spatiales Mr Dib Abderrahim & Dr Mohamed-Khireddine KHOLLADI

Fouille de données spatiales Mr Dib Abderrahim & Dr Mohamed-Khireddine KHOLLADI Fouille de données spatiales Mr Dib Abderrahim & Dr Mohamed-Khireddine KHOLLADI Introduction On assiste de plus en plus à la création d entrepôts de données. Les raisons sont multiples : 1. le tout numérique

Plus en détail