Etiquetage Morphosyntaxique
|
|
- Claude Doré
- il y a 8 ans
- Total affichages :
Transcription
1 Etiquetage Morphosyntaxique François Yvon École Nationale Supérieure des télécommunications Département Informatique et Réseaux 13 mars 2007 Etiquetage morphosyntaxique Un premier niveau de modélisation d une phrase (1) La/DET coronarographie/n met/v en/prep évidence/n des/det lésions/n bitronculaires/adj./pointfinal Version de base Nom Verbe Prep Adj Adv Det Pro Conj Ponct Préfixe Intj Sigle Date Versions étendues NomMS... Vinf... DetFS... DetDem... ProRel... ConjC... PointF Virgule...
2 Etiquetage morphosyntaxique Désambiguïsation lexicale Étiquetage morphosyntaxique «Part-of-speech tagging» Problème de classification séquentiel : déterminer la catégorie lexicale de chaque mot d un texte sans effectuer une analyse syntaxique complète des phrases... en s appuyant sur des lexiques, des connaissances morphologiques, et le contexte d occurrence. De multiples applications Préparation de l analyse syntaxique : réduction de l ambiguïté la/det - la/pp. Lemmatisation / Indexation : résolution des homographies vase/nf - vase/nm. Repérage de termes par appariement de patrons. un terme est une association fréquente respectant des formes : N DE N : algorithme d optimisation ; V N : remonte pente... Synthèse vocale à partir du texte Désambiguïsation des homographes (but/v -but/n, couvent/n - couvent/n)...
3 Problèmes Un mot plusieurs catégories lexicales : (2) La/DET/N/PRO coronarographie/n/v est/a/n/v normale/a/n. (3) Polyarthrite/N rhumatoïde/? avec/adv/prep atteinte/n/v viscérale/a traitée/v par/n/prep LASILIX/? Un problème massif : 50% des occurrences! Une phrase de 20 mots à 2 10 analyses possibles. Les mots inconnus (noms propres, emprunts, sigles) : quelles étiquettes a priori? Le contexte est lui même ambigu : des erreurs en cascade? Règles d étiquetage Prise en compte du contexte local : (4) DET/PRO V PRO V «Grammaires locales» d INTEX (Silberztein, 1993) Transducteurs de Xerox (Chanod & Tapanainen, 1995) + Fondement linguistique ; règles lisibles, modifiables manuellement, facilite la compréhension des erreurs + Implémantation (automates finis) - Écriture manuelle des règles : difficile, délicat et très coûteux. - Robustesse : traitement des entrées bruitées ; des OOVs
4 Une grammaire locale d INTEX!! exempl : il/pro la/det/n/pro ferme/a/n/v Grammaires locales : implantation Une phrase est un automate fini S L ensemble des analyses possibles s obtient par projection (composition) avec le lexique L Chaque règle exprime des restrictions sur les séquences licites d étiquettes, représentables par un automate fini R i L intersection des R i correspond à l ensemble des contraintes, et peut être optimisée (minimisation, déterminisation) Désambiguïser = S L ( T i R i) Implantations efficaces : 10K mots / secondes.
5 Apprendre par correction : l étiquetteur de Brill Apprentissage fondé sur des transformations (Transformation-based error-driven learning), guidé par les erreurs (Brill, 1995 ; de Loupy, 1995) Idée : Étiqueteur [E 0 ] très simple mais approximatif : l étiquette la plus probable (hors contexte). Apprendre itérativement des règles de correction des sorties de E 0 : E 1... E n Apprentissage par correction : vue d ensemble Texte brut Annotation intiale 1. Espace des transformations 2. Fonction d évaluation 3. Règles ordonnées Texte annoté Annotations correctes 1 2 Apprenti EBT Règles de correction 3
6 Règles de correction Règles de récriture changer l étiquette de Déterminant en Pronom si le mot suivant est un Verbe conjugué (6) Il/PRO la/det voit/v Il/PRO la/pro voit/v Espace des règles contextuelles changer l étiquette de a à b lorsque : le mot précédent (suivant) est étiqueté z le deuxième mot qui précède (suit) est étiqueté z l un des deux mots qui précèdent (suivent) est étiqueté z l un des trois mots qui précèdent (suivent) est étiqueté z le mot précédent est étiqueté z et le mot suivant est étiqueté w le mot précédent (suivant) est étiqueté z et le deuxième mot qui précède (suit) est étiqueté w
7 Exemples de règles (Winbrill) PRV:++ PREP WDNEXTTAG en ADJ:sg SBC:pl ADJ:pl PREV1OR2TAG SBC:pl PRO:sg PRV:sg PREVTAG - DTN:sg PRV:sg NEXTTAG ACJ:sg PRV:sg PRO:sg WDPREVTAG PREP elle VPAR:sg ADJ1PAR:sg PREV1OR2OR3TAG ECJ:sg DTN:pl PRV:pl LBIGRAM à les SUB$ SUB PREVTAG PREP VCJ:sg VPAR:sg PREV1OR2OR3TAG ACJ:sg ADJ:sg SBC:sg SURROUNDTAG DTN:sg PREP Espace des règles lexicales changer l étiquette de a à b lorsque : le mot courant (suivant) est z le mot courant est z et le mot précédent est w le mot courant est z et le mot suivant est v le suffixe de longueur k du mot courant est s le mot courant débute par une majuscule... Augmenter l espace des règles augmente la complexité de la recherche de la meilleure transformation!
8 Exemples de règles lexicales (Winbrill) e char SBC:sg s hassuf 1 SBC:pl it hassuf 2 VCJ:sg nt hassuf 2 VCJ:pl er hassuf 2 VNCFF NN i fchar SBC:sg * char SBP:sg 598 a hassuf 1 VCJ:sg 459 VCJ:pl ant fhassuf 3 VNCNT ment hassuf 4 ADV 323 un goodright SBC:sg je goodright VCJ:sg SBC:sg ez fhassuf 2 VCJ:pl 259 Apprendre par correction : les points forts + Acquisition automatique des règles + Obtient des résultats aussi bons que les méthodes probabilistes + en se contentant d un corpus d apprentissage beaucoup plus petit + Les règles sont compréhensibles, et peuvent être modifiées à la main + Nombre de règles moins élevé ( 100) + Implantations efficaces (combinaison de transducteurs)
9 Autres types d apprentissage Point de vue classification : mapping contexte une classe/l étiquette Plus proches voisins Régressions logistique / modèles maximum d entropie Séparateurs vaste marge (SVM) Point de vue transcodage : mapping Σ 1 Σ 2 probabilisation de Σ 1 Σ 2 (HMM) fonction de Sigma 1 vers Sigma 2 (CRFs) Etiqueteurs probabilistes : HMM et variantes Modèle probabiliste sur les séquences de couples (mot, étiquette) : p(m, E) M = w i 2 w i 1 w i mots E = e i 2 e i 1 e i étiquettes La meilleure décision E maximise : Hypothèses simplificatrices : p(e M) = p(m, E ) p(m) = p(e )p(m E) p(m) Les séquences d étiquettes sont Markoviennes d ordre k : p(e 1... e n ) = p(e 1 ) ky p(e i e i 1 ) à l ordre 2 i=1 L émission du mot w i ne dépend que de l étiquette courante p(w i e 1... e i, w 1... w i ) = p(w i e i ) paramètres du modèles : probabilités de transition p(e i e i k+1... e i 1 ) (n k c) probabilité d émission p(w j e i ) (n c n w )
10 Etiqueteurs probabilistes (suite) Implantation (Viterbi, Baum Welsch, Lissage) Etiqueteurs probabilistes (discussion) + Acquisition automatique des probabilités + Très bons résultats + Implantations efficaces (transducteurs pondérés) + De nombreuses variantes (modèles MaxEnt, Champs conditionnels aléatoires) - Grand nombre de «règles probabilistes» (paramètres) - Les raisons pour lesquelles l étiquetage fonctionne bien ou échoue sont très difficilement accessibles - plafonnement des performance ; il est difficile d analyser, de comprendre et d améliorer la capacité de ces approches à modéliser le comportement linguistique sous-jacent
11 Etiqueteurs du Français Xerox demos/ Input : La petite ferme du père Fouchard se trouve à la sortie du défilé. Résultats : La le +DET_SG petite petit +ADJ2_SG ferme ferme +NOUN_SG du de=le +PREP_DE père père +NOUN_SG Fouchard Fouchard +guessed+noun_inv se se +PC trouve trouver +VERB_P3SG à à +PREP_A la le +DET_SG sortie sortie +NOUN_SG Un exemple d utilisation TreeTagger/DecisionTreeTagger.html Créer un dossier TreeTagger, s y placer, et télécharger : les exécutables les scripts d étiquetages les ressources (dépendant de la langue) le script d installation Lancer l installation : sh install-tagger.sh lancer l étiquetage : cmd/tree-tagger-french fichier.txt >fichier.tt
12 Identification des groupes But : repérer des constituants linéaires : groupe nominal simple, noyau verbal, etc repérage des frontières étiquetage des groupes (par l étiquette de la tête) Intuition : rassembler les têtes (mots pleins) et leurs dépendants locaux verbe et auxiliaires, verbe et adverbes nom et déterminant adjectif et adverbes Applications : groupes de souffles (synthèse vocale) extraction de termes parsage robuste (énoncés bruités, etc). Approches du chunking Symboliques : spécification des patrons de groupes : GN DETADJ NNADJ implémentés par des transducteurs finis Numériques : tâche d étiquettage séquentiel Paul/NN ne/adv mange/vrb avec/prep plaisir/nn que/ B GN B GV I GV B GP I GP B mêmes techniques que pour POS
13 Quelques références CHANOD, J.-P. & TAPANAINEN, P. (1995). Statistical and constraint-based taggers for French. In Proc 7th EACL, Dublin, Ireland. SILBERZTEIN, M. (1993). Dictionnaires électroniques et analyse automatique de textes : le système INTEX. Paris : Masson. CHARNIAK E (1993). Statistical Language Learning, Cambridge : MIT Press (1993). BRILL, E. (1995). Transformation-based error-driven learning and naturallanguage processing : A case study in part-of-speech tagging. Computational Linguistics, 21(4), DE LOUPY, C. (1995). La méthode d Étiquetage d Eric Brill. Traitement Automatique des Langues, 36(1-2), HABERT, B., NAZARENKO, A. & SALEM, A. (1997). Les linguistiques de corpus. Paris : Armand Colin. ABNEY, S. Parsing (1996) : Partial Parsing via Finite-State Cascades, J. of Natural Language Engineering, 2(4) : Quelques implémantations libres acopost (acopost.sourceforge.net) : HMM, MaxEnt, Transformation-based learning (C) opennlp (sourceforge.net/projects/maxent/ : MaxEnt (python) Brill ( : implémentation originale de Brill
14 Etiquetage morphosyntaxique : une tâche emblématique problème quasi-résolu des méthodes d apprentissage sont très performantes un problème générique : assigner des catégories à des tokens identification des débuts/fins de phrase, de groupes syntaxiques identification des débuts/fins d entités nommées (noms de personnes, de lieux...)...
Apprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détail1 Description générale. Résumé
Station Sensunique: une plateforme Web modulaire, collaborative et évolutive d acquisition assistée de ressources terminologiques et non terminologiques (orientée Langues Contrôlées) Izabella Thomas 1,
Plus en détailAnnotations manuelles et automatiques de corpus
Annotations manuelles et automatiques de corpus Cyril Grouin cyril.grouin@limsi.fr 1 Définitions Base de données : ensemble structuré de données (feuille Excel). Id Ville Pays 01 Paris France 02 Dublin
Plus en détailUn dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus
JEP-TALN 2004, Traitement Automatique de l Arabe, Fès, 20 avril 2004 Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus ZAAFRANI Riadh Faculté des Sciences Juridiques,
Plus en détailUTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES
UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES Chrystel Millon & Stéphanie Léon Equipe DELIC Université de Provence
Plus en détail! Text Encoding Initiative
Format XML: suite! le contenu d un élément est la concaténation de! texte! et d éléments (imbrication)! => structure arborescente! pas de chevauchement de balises! => exemple : une analyse syntagmatique
Plus en détailDétection des propositions syntaxiques du français : en vue de l alignement des propositions de textes parallèles français-japonais
Détection des propositions syntaxiques du français : en vue de l alignement des propositions de textes parallèles français-japonais Yayoi Nakamura-Delloye To cite this version: Yayoi Nakamura-Delloye.
Plus en détail(TALN) . Traitement Automatique du Langage Naturel. Outils d analyse de données textuelles. Laurent Audibert (LIPN - UMR CNRS 7030) 4 novembre 2010
Traitement Automatique du Langage Naturel (TALN) Outils d analyse de données textuelles Université Paris 13 Laboratoire d Informatique de Paris-Nord (LIPN) 4 novembre 2010 Problématique du TALN TALN :
Plus en détailTrois approches du GREYC pour la classification de textes
DEFT 2008, Avignon (associé à TALN 08) Trois approches du GREYC pour la classification de textes Thierry Charnois Antoine Doucet Yann Mathet François Rioult GREYC, Université de Caen, CNRS UMR 6072 Bd
Plus en détailMATHÉMATIQUES ET INFORMATIQUE
Premier volet : la théorie des langages 1 Christian Retoré 2 MATHÉMATIQUES ET INFORMATIQUE Les mathématiques de la linguistique computationnelle 1947, un grand millésime : à Jean-Yves Girard, Gérard Huet
Plus en détailApplication d un algorithme de traduction statistique à la normalisation de textos
Application d un algorithme de traduction statistique à la normalisation de textos Gabriel Bernier-Colborne 1 (1) Observatoire de linguistique Sens-Texte Université de Montréal gabriel.bernier-colborne@umontreal.ca
Plus en détailRecherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA
RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE
Plus en détailFRENCH 3900- Language (Advanced Level III)
Professeur : Ivan Chow (ichow3@uwo.ca) Consultation : Par rendez-vous enligne ou par courriel Description générale du cours : FRENCH 3900- Language (Advanced Level III) grammaticale fournie dans & al.
Plus en détailN 334 - SIMON Anne-Catherine
N 334 - SIMON Anne-Catherine RÉALISATION D UN CDROM/DVD CONTENANT DES DONNÉES DU LANGAGE ORAL ORGANISÉES EN PARCOURS DIDACTIQUES D INITIATION LINGUISTIQUE A PARTIR DES BASES DE DONNÉES VALIBEL Introduction
Plus en détailmajuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot
majuscu conjugaison >>>, L orthographe singulier syllabe virgule mémoire lettres et son enseignement graphie suffixe usage accent ; écrire féminin temps voyelles mot point Renforcer l enseignement de l
Plus en détailACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES
ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES Techniques symboliques de traitement automatique du langage pour l indexation thématique et l extraction d information temporelle Thèse Défense publique
Plus en détailApprentissage statistique dans les graphes et les réseaux sociaux
Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique
Plus en détailRessources lexicales au service de recherche et d indexation des images
RECITAL 2011, Montpellier, 27 juin - 1er juillet 2011 Ressources lexicales au service de recherche et d indexation des images Inga Gheorghita 1,2 (1) ATILF-CNRS, Nancy-Université (UMR 7118), France (2)
Plus en détailGRIVEL Luc, GUILLEMIN-LANNE Sylvie, COUPET Pascal, HUOT Charles {luc.grivel, sylvie.guillemin-lanne, pascal.coupet, charles.huot} @temis-group.
Analyse en ligne de l information : une approche permettant l extraction d informations stratégiques basée sur la construction de composants de connaissance GRIVEL Luc, GUILLEMIN-LANNE Sylvie, COUPET Pascal,
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailMulti-catégorisation de textes juridiques et retour de pertinence
Multi-catégorisation de textes juridiques et retour de pertinence Vincent Pisetta, Hakim Hacid et Djamel A. Zighed article paru dans G. Ritschard et C. Djeraba (eds), Extraction et gestion des Connaissances
Plus en détailContemporary Engineering Sciences, Vol. 2, 2009, no. 4, 191-208
Contemporary Engineering Sciences, Vol. 2, 2009, no. 4, 191-208 Conception d un Tuteur Intelligent en langage naturel français pour l enseignement de la modélisation conceptuelle des données d un système
Plus en détailÉvaluation de G-LexAr pour la traduction automatique statistique
TALN 2011, Montpellier, 27 juin 1 er juillet 2011 Évaluation de G-LexAr pour la traduction automatique statistique Wigdan Mekki (1), Julien Gosme (1), Fathi Debili (2), Yves Lepage (3), Nadine Lucas (1)
Plus en détailLA CONJONCTION MÊME SI N EXISTE PAS!
LA CONJONCTION MÊME SI N EXISTE PAS! Mireille Piot To cite this version: Mireille Piot. LA CONJONCTION MÊME SI N EXISTE PAS!. Christian Leclère, Eric Laporte, Mireille Piot et Max Silberztein éds. Benjamins,
Plus en détailLEXOS, logiciel d'étude lexicale et de conjugaison
233, logiciel d'étude lexicale et de conjugaison Ce logiciel a été élaboré sous test constant, dans la mesure où, pour le modifier, je me suis inspiré en permanence de la réaction des élèves, de leurs
Plus en détail1 On peut consulter et interroger ce corpus sur le site de l équipe DELIC : http://www.up.univmrs.fr/delic/crfp.
Ce que les corpus nous apprennent sur la langue Bilger Mireille (Université de Perpignan) - bilger@univ-perp.fr Cappeau Paul (Université de Poitiers) - Paul.Cappeau@univ-poitiers.fr La description syntaxique
Plus en détailExtraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet
Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirilet RÉSUMÉÑÓ Ñ ºÑÓÖ ÙÒ Ú¹ Ú ÒÓÒº Ö ÓÖ ºÐ Ò Ö ÙÒ Ú¹ Ú ÒÓÒº Ö Mohamed Morid 1 Georges Linarès 1 (1) LIA-CERI, Université d Avignon
Plus en détailTiLT : plate-forme pour le traitement automatique des langues naturelles
TiLT : plate-forme pour le traitement automatique des langues naturelles Johannes Heinecke * Grégory Smits ** Christine Chardenon * Emilie Guimier De Neef * Estelle Maillebuau * Malek Boualem * * Orange
Plus en détailTableau des contenus
Tableau des contenus Dossier 1 L image dans les relations amicales, sociales, professionnelles et amoureuses Dossier 2 Présenter quelqu un Je séduis. Parler de son rapport à l image. Caractériser des personnes
Plus en détailLaboratoire 4 Développement d un système intelligent
DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement
Plus en détailCONSTITUTION D'UN CORPUS D'ERREURS DU DACTYLOGRAPHE
CONSTITUTION D'UN CORPUS D'ERREURS DU DACTYLOGRAPHE Agnès Souque LIDILEM Université Stendhal Grenoble RÉSUMÉ La rédaction de textes sur ordinateur est aujourd'hui difficilement dissociable de l'utilisation
Plus en détailExtraction automatique de terminologie à partir de libellés textuels courts
Extraction automatique de terminologie à partir de libellés textuels courts Jean-Claude Meilland ismart Le Mercure A, 565 Rue Berthelot 13851 Aix en Provence Cedex 3 (France) jean-claude.meilland@ismart.fr
Plus en détailLuc Grivel (*, **) Luc.Grivel@univ-paris1.fr
MAITRISER LE PROCESSUS DE TEXT MINING DANS LE CADRE D APPLICATIONS D INTELLIGENCE ECONOMIQUE, DE GESTION DE LA RELATION CLIENT OU DE GESTION DE CONNAISSANCES Luc Grivel (*, **) Luc.Grivel@univ-paris1.fr
Plus en détailTP 1. Prise en main du langage Python
TP. Prise en main du langage Python Cette année nous travaillerons avec le langage Python version 3. ; nous utiliserons l environnement de développement IDLE. Étape 0. Dans votre espace personnel, créer
Plus en détailADAPT: un modèle de transcodage des nombres. Une application des systèmes de production au développement
ADAPT: un modèle de transcodage des nombres Une application des systèmes de production au développement Référence Barrouillet, P., Camos, V., Perruchet, P., & Seron, X. (2004). A Developmental Asemantic
Plus en détailÉvaluation et implémentation des langages
Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation
Plus en détailInterférences lexicales entre deux langues étrangères: anglais et français
Interférences lexicales entre deux langues étrangères: anglais et français Université de Marmara Résumé: Dans cet article, nous nous interrogerons sur les transferts lexicaux qui se réalisent entre l anglais
Plus en détailExpériences de formalisation d un guide d annotation : vers l annotation agile assistée
Expériences de formalisation d un guide d annotation : vers l annotation agile assistée Bruno Guillaume 1,2 Karën Fort 1,3 (1) LORIA 54500 Vandœuvre-lès-Nancy (2) Inria Nancy Grand-Est (3) Université de
Plus en détailTraitement automatique des entités nommées en arabe : détection et traduction
Traitement automatique des entités nommées en arabe : détection et traduction Souhir Gahbiche-Braham Hélène Bonneau-Maynard François Yvon Université Paris Sud & LIMSI-CNRS BP 133-91403 ORSAY Cedex - France
Plus en détailFormation Pédagogique 3h
Formation Pédagogique 3h Carole MOULIN Conseillère Pédagogique généraliste Bourgoin 2 20 mars 2013 Ecrire c est: Copier Ecrire sans erreurs sous la dictée Concevoir et écrire une phrase, des phrases, un
Plus en détailAnalyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Plus en détailExtraction automatique de modèles de processus pour l étude de la résolution collective de problèmes dans les communautés du logiciel libre
Extraction automatique de modèles de processus pour l étude de la résolution collective de problèmes dans les communautés du logiciel libre Gabriel Ripoche 1,2 gripoche@uiuc.edu Les Gasser 1 gasser@uiuc.edu
Plus en détailE-Gen : traitement automatique des offres d emploi
591 E-Gen : traitement automatique des offres d emploi Rémy Kessler 1, 2, Marc El-Bèze 1 1 Laboratoire Informatique d Avignon, BP 1228 F-84911 Avignon Cedex 9 FRANCE 2 AKTOR Interactive Parc Technologique
Plus en détailTraitement bas-niveau
Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.
Plus en détailPROJET DE FIN D ETUDES
MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE ****** INSTITUT NATIONAL DES SCIENCES APPLIQUEES TOULOUSE Département de Génie Electrique & Informatique ****** PROJET DE FIN D ETUDES ROLE D UNE
Plus en détailCompte-rendu de Hamma B., La préposition en français
Compte-rendu de Hamma B., La préposition en français Badreddine Hamma To cite this version: Badreddine Hamma. Compte-rendu de Hamma B., La préposition en français. Revue française de linguistique appliquée,
Plus en détailLinked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton
Linked Open Data Le Web de données Réseau, usages, perspectives Sommaire Histoire du Linked Open Data Structure et évolution du réseau Utilisations du Linked Open Data Présence sur le réseau LOD Futurs
Plus en détailCORRIGÉ DU DOSSIER N 2
Christian PUREN Professeur émérite de l Université de Saint-Étienne (France) Cours collaboratif en ligne «La didactique des langues-cultures comme domaine de recherche» http://www.christianpuren.com/cours-collaboratif-la-dlc-comme-domaine-de-recherche/
Plus en détailANALYSE SÉMANTICO-DISCURSIVE DES COLLOCATIONS LEXICALES EN CORPUS SPÉCIALISÉ : LA BASE CONNAISSANCE-S
ANALYSE SÉMANTICO-DISCURSIVE DES COLLOCATIONS LEXICALES EN CORPUS SPÉCIALISÉ : LA BASE CONNAISSANCE-S Estelle Dubreil et Béatrice Daille LINA FRE CNRS 2729 Université de Nantes France Résumé : L association
Plus en détailEcole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011. Atelier 1: Sphinx. import, conversion, export de données
Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011 Atelier 1: Sphinx import, conversion, export de données Introduction à la Recherche d'ist via le Web INRA Grignon, 03/2011
Plus en détailLa répétition de phrases comme aide au diagnostic des enfants dysphasiques C. Maillart*, A.L. Leclercq*, P. Quemart*
Entretiens de Bichat Orthophonie 2012 La répétition de phrases comme aide au diagnostic des enfants dysphasiques C. Maillart*, A.L. Leclercq*, P. Quemart* * Université de Liège, Unité de logopédie Clinique,
Plus en détailVers la correction automatique de textes bruités: Architecture générale et détermination de la langue d un mot inconnu
Vers la correction automatique de textes bruités: Architecture générale et détermination de la langue d un mot inconnu Marion Baranes To cite this version: Marion Baranes. Vers la correction automatique
Plus en détailIndexation sémantique au moyen de coupes de redondance minimale dans une ontologie
TALN 25, Dourdan, 6 1 juin 25 Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie Florian Seydoux & Jean-Cédric Chappelier Faculté Informatique et Communications Ecole Polytechnique
Plus en détailEXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE
ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École
Plus en détailPrévalence et étiologie. Le retard mental : langage et communication. Définitions et classifications (2) Définitions et classifications
Le retard mental : langage et communication M. - A. SCHELSTRAETE Unité CODE Prévalence et étiologie Prévalence: 25 / 1000 20 / 1000 déficience légère (QI > 50) 4-5 / 1000 déficience grave (QI < 50) = fréquence
Plus en détailCréer un mémento grammatical portatif et évolutif pour tablettes et smartphones
Enseigner les Langues et Cultures de l Antiquité avec les TICE http://lettres.ac-dijon.fr TraAM travaux académiques mutualisés, un accompagnement au développement des usages des TIC Créer un mémento grammatical
Plus en détailMéthode de classification des réponses d un moteur de recherche
SETIT 2005 3 rd International Conference: Sciences of Electronic, Technologies of Information and Telecommunications March 27-31, 2005 TUNISIA Méthode de classification des réponses d un moteur de recherche
Plus en détailEtudes des échanges électroniques sur internet et intranet : forums et courriers électroniques
Beaudouin V., Fleury S., Velkovska J. (2000). " Études des échanges électroniques sur internet et intranet : forums et courriers électroniques ". In M. Rajman & J.-C. Chappelier (éd), JADT 2000. 5emes
Plus en détailLIVRET PERSONNEL DE COMPÉTENCES
Nom... Prénom... Date de naissance... Note aux parents Le livret personnel de compétences vous permet de suivre la progression des apprentissages de votre enfant à l école et au collège. C est un outil
Plus en détailChap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1
Chap 4: Analyse syntaxique 1 III- L'analyse syntaxique: 1- Le rôle d'un analyseur syntaxique 2- Grammaires non contextuelles 3- Ecriture d'une grammaire 4- Les méthodes d'analyse 5- L'analyse LL(1) 6-
Plus en détailAbdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole
ÉCOLE DOCTORALE SCIENCES ET TECHNOLOGIES (ORLEANS) FACULTÉ de TECHNOLOGIE (Sétif) Laboratoire PRISME THÈSE EN COTUTELLE INTERNATIONALE présentée par : Abdenour Hacine-Gharbi soutenue le : 09 décembre 2012
Plus en détailMode d emploi MD6000F
LE DICTIONNAIRE ÉLECTRONIQUE MULTIMÉDIA Mode d emploi MD6000F 2 Copyright Lexibook 2003 SOMMAIRE Page Page Introduction......................... 5 1. Caractéristiques générales.......... 5 1.1 Guide des
Plus en détailfiche D AUTOCORRECTION Frimousse, une petite chienne qu'on a adoptée le mois dernier, est intelligente et docile.
fiche D AUTOCORRECTION 3.4 Les accords sont corrects dans chaque groupe du nom. On met souvent sur le dos de l inattention les erreurs d orthographe grammaticale. Bien accorder les mots exige de l observation
Plus en détailI. Le déterminant Il détermine le nom. Le déterminant indique le genre, le
I. Le déterminant Il détermine le nom. Le déterminant indique le genre, le nombre et le degré de détermination du nom. 1. L article le, la, les, l, d, au, aux, du, des, un, une, des, du, de l, de la, des.
Plus en détailAtelier rédactionnel
Baccalauréat professionnel Gestion - Administration Atelier rédactionnel Exemples de séances réalisées en première et au début de l année de terminale Joëlle PERRETIER & Patrice VIRIEUX Lycée professionnel
Plus en détailmes m est mets/met mais mets
GRAMMATICAUX DE CATÉGORIES DIFFÉRENTES MES HOMOPHONES M EST METS/MET MAIS METS 1 Homophones grammaticaux de catégories différentes mes m est mets/met mais mets mes : déterminant possessif pluriel, féminin
Plus en détailLivret personnel de compétences
Livret personnel de compétences Grilles de références pour l évaluation et la validation des compétences du socle commun au palier 2 Janvier 2011 MENJVA/DGESCO eduscol.education.fr/soclecommun LES GRILLES
Plus en détailTransmission d informations sur le réseau électrique
Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en
Plus en détailGrammaires d unification
Cours sur le traitement automatique des langues (IV) Violaine Prince Université de Montpellier 2 LIRMM-CNRS Grammaires d unification Grammaire catégorielle Grammaire syntagmatique généralisée (GPSG) Les
Plus en détailLa construction de composants de connaissance pour l extraction et le filtrage de l information sur les réseaux
La construction de composants de connaissance pour l extraction et le filtrage de l information sur les réseaux une approche industrielle Grivel Luc, Guillemin-Lanne Sylvie, Lautier Christian, Mari Alda
Plus en détailDe la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues
De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues Maud Ehrmann Joint Research Centre Ispra, Italie. Guillaume Jacquet Xerox
Plus en détailDEFT 09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique
DEFT 09 «DÉfi Fouille de Textes», Atelier de clôture, Paris, 22 juin 2009 DEFT 09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique
Plus en détailLa phonétisation de "plus", "tous" et de certains nombres : une analyse phono-syntaxique
La phonetisation de "plus", "tous" et de certains nombres. La phonétisation de "plus", "tous" et de certains nombres : une analyse phono-syntaxique Jean-Philippe Goldman, Christopher Laenzlinger et Eric
Plus en détailFormation Actuaire Data Scientist. Programme au 24 octobre 2014
Formation Actuaire Data Scientist Programme au 24 octobre 2014 A. Eléments logiciels et programmation Python 24h Objectif : Introduction au langage Python et sensibilisation aux grandeurs informatiques
Plus en détailDafoe Présentation de la plate-forme UIMA
Laboratoire d Informatique de l université Paris-Nord (UMR CNRS 7030) Institut Galilée - Université Paris-Nord 99, avenue Jean-Baptiste Clément 93430 Villetaneuse, France 11 juillet 2007 Plates-formes
Plus en détailCaractéristiques du nom
DU MATÉRIEL NOM POUR ALLOPHONES 1 Nom et groupe nominal Caractéristiques du nom 1 LES CARACTÉRISTIQUES SÉMANTIQUES DU NOM Le nom commun désigne une personne ou une chose qui appartient à une même espèce.
Plus en détailModélisation d'une ontologie de domaine et des outils d'extraction de l'information associés pour l'anglais et le français
Modélisation d'une ontologie de domaine et des outils d'extraction de l'information associés pour l'anglais et le français Nom : SERRANO Prénom : Laurie UFR des Sciences du Langage Mémoire de master 2
Plus en détailUne approche de désambiguïsation morpho_lexicale évaluée sur l analyseur morphologique Alkhalil*
Une approche de désambiguïsation morpho_lexicale évaluée sur l analyseur morphologique Alkhalil* K.Z Bousmaha 1,2, S. Charef_Abdoun 1, L. Hadrich_Belguith 2, M.K Rahmouni 1 1Université d Oran, Faculté
Plus en détailRéaliser un journal scolaire
Réaliser un journal scolaire 1/ Connaître le journal et ses contenus Pour que les élèves puissent à leur tour devenir producteurs, il faut absolument qu ils apprennent à connaître le journal et ses contenus.
Plus en détailDe la mesure à l analyse des risques
De la mesure à l analyse des risques Séminaire ISFA - B&W Deloitte Jean-Paul LAURENT Professeur à l'isfa, Université Claude Bernard Lyon 1 laurent.jeanpaul@free.fr http://laurent.jeanpaul.free.fr/ 0 De
Plus en détaile-recrutement : recherche de mots-clés pertinents dans le titre des annonces d emploi
e-recrutement : recherche de mots-clés pertinents dans le titre des annonces d emploi Julie Séguéla 1, 2, Gilbert Saporta 1, Stéphane Le Viet 2 1 Laboratoire Cédric CNAM 292 rue Saint Martin 75141 Paris
Plus en détailÉvaluation transparente de systèmes de questions-réponses : application au focus
RÉCITAL 2007, Toulouse, 5 8 juin 2007 Évaluation transparente de systèmes de questions-réponses : application au focus Sarra EL AYARI LIMSI-CNRS, BP 133, F-91403 ORSAY Sarra.ElAyari@limsi.fr Résumé. Les
Plus en détailProjet de Master en Informatique: Web WriteIt!
Projet de Master en Informatique: Web WriteIt! Web WriteIt! Baris Ulucinar Supervisé par le Prof. Rolf Ingold, Dr. Jean Hennebert, Andreas Humm et Robert Van Kommer Avril 2007 Table des matières 2 1. Introduction
Plus en détailAtelier ATOLL pour les grammaires d arbres adjoints
TALN 2001, Tours, 2-5 juillet 2001 Atelier ATOLL pour les grammaires d arbres adjoints François Barthélemy 1, Pierre Boullier 2, Philippe Deschamp 2, Linda Kaouane 2 et Éric Villemonte de la Clergerie
Plus en détailLe traitement automatique des langues dans les industries de l'information
Le traitement automatique des langues dans les industries de l'information Livre blanc Groupe de Réflexion sur les Industries de l Information et les Industries de la Langue (GRIIIL) Janvier 2005 Avant-propos
Plus en détailAlgorithmes d'apprentissage
Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt
Plus en détailpythonocc: une plateforme de développement agile d applications CAO.
pythonocc: une plateforme de développement agile d applications CAO. PyConFR 2009 Cité des Sciences et de l Industrie, Paris Thomas Paviot*, Jelle Feringa* *pythonocc project: tpaviot@gmail.com; jelleferinga@gmail.com
Plus en détailLa traduction automatique des articles de l anglais au français
Université de Gand Faculté de Philosophie et Lettres Année universitaire 2012-2013 La traduction automatique des articles de l anglais au français Lissa Catthoor Mémoire de master présenté en vue de l
Plus en détailLe modèle standard, SPE (1/8)
Le modèle standard, SPE (1/8) Rappel : notion de grammaire mentale modulaire Les composants de la grammaire : module phonologique, sémantique syntaxique Syntaxe première : elle orchestre la relation mentale
Plus en détailLaboratoire d Informatique, de Traitement de l Information et des Systèmes EA 4108. 3 établissements T. Paquet D. Olivier T. Lecroq A.
Laboratoire d Informatique, de Traitement de l Information et des Systèmes EA 4108 3 établissements T. Paquet D. Olivier T. Lecroq A. Benshrair 7 équipes Disciplines 27-61, 25-26-43-64 L. Heutte DocApp
Plus en détailBoléro. d information. Notice
Notice Boléro d information Boléro est construit dans la perspective d un investissement sur la durée totale de la formule et donc d un rachat aux dates d échéances indiquées. Tout rachat de part à d autres
Plus en détailHomophones grammaticaux de catégories différentes. ce se
GRAMMATICAUX DE CATÉGORIES DIFFÉRENTES CE HOMOPHONES SE 1 Homophones grammaticaux de catégories différentes ce se ce : déterminant démonstratif masculin singulier. Il fait partie d un GN dont le noyau
Plus en détailInstrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos
Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos Laurent Veillard UMR ICAR (CNRS, Université Lyon 2, ENS de lyon)
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailLe nous du général de Gaulle
Le nous du général de Gaulle Dominique Labbé To cite this version: Dominique Labbé. Le nous du général de Gaulle. Quaderni di studi linguistici, 1998, 4/5, pp.331-354. HAL Id: halshs-00675362
Plus en détailMorphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations
U Université dumaine Faculté des Lettres, Langues et Sciences humaines Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations Carole Lailler 1 L interrogation : une modalité
Plus en détailTableau mettant en relation les niveaux du CECRL et les programmes IFALPES par compétences.
Tableau mettant en relation les niveaux du CCRL et les programmes IFALPS par compétences. A1 CCRL CONTNU DU PROGRAMM A1 IFALPS Compréhension orale. C Des formules de politesse et de salutation O Je peux
Plus en détailObservatoire des ressources numériques adaptées
Observatoire des ressources numériques adaptées INS HEA 58-60 avenue des Landes 92150 Suresnes orna@inshea.fr IDENTIFIANT DE LA FICHE Y'a pas photo DATE DE PUBLICATION DE LA FICHE Mars 2015 MOT -CLE LIBRE
Plus en détail