Etiquetage Morphosyntaxique

Dimension: px
Commencer à balayer dès la page:

Download "Etiquetage Morphosyntaxique"

Transcription

1 Etiquetage Morphosyntaxique François Yvon École Nationale Supérieure des télécommunications Département Informatique et Réseaux 13 mars 2007 Etiquetage morphosyntaxique Un premier niveau de modélisation d une phrase (1) La/DET coronarographie/n met/v en/prep évidence/n des/det lésions/n bitronculaires/adj./pointfinal Version de base Nom Verbe Prep Adj Adv Det Pro Conj Ponct Préfixe Intj Sigle Date Versions étendues NomMS... Vinf... DetFS... DetDem... ProRel... ConjC... PointF Virgule...

2 Etiquetage morphosyntaxique Désambiguïsation lexicale Étiquetage morphosyntaxique «Part-of-speech tagging» Problème de classification séquentiel : déterminer la catégorie lexicale de chaque mot d un texte sans effectuer une analyse syntaxique complète des phrases... en s appuyant sur des lexiques, des connaissances morphologiques, et le contexte d occurrence. De multiples applications Préparation de l analyse syntaxique : réduction de l ambiguïté la/det - la/pp. Lemmatisation / Indexation : résolution des homographies vase/nf - vase/nm. Repérage de termes par appariement de patrons. un terme est une association fréquente respectant des formes : N DE N : algorithme d optimisation ; V N : remonte pente... Synthèse vocale à partir du texte Désambiguïsation des homographes (but/v -but/n, couvent/n - couvent/n)...

3 Problèmes Un mot plusieurs catégories lexicales : (2) La/DET/N/PRO coronarographie/n/v est/a/n/v normale/a/n. (3) Polyarthrite/N rhumatoïde/? avec/adv/prep atteinte/n/v viscérale/a traitée/v par/n/prep LASILIX/? Un problème massif : 50% des occurrences! Une phrase de 20 mots à 2 10 analyses possibles. Les mots inconnus (noms propres, emprunts, sigles) : quelles étiquettes a priori? Le contexte est lui même ambigu : des erreurs en cascade? Règles d étiquetage Prise en compte du contexte local : (4) DET/PRO V PRO V «Grammaires locales» d INTEX (Silberztein, 1993) Transducteurs de Xerox (Chanod & Tapanainen, 1995) + Fondement linguistique ; règles lisibles, modifiables manuellement, facilite la compréhension des erreurs + Implémantation (automates finis) - Écriture manuelle des règles : difficile, délicat et très coûteux. - Robustesse : traitement des entrées bruitées ; des OOVs

4 Une grammaire locale d INTEX!! exempl : il/pro la/det/n/pro ferme/a/n/v Grammaires locales : implantation Une phrase est un automate fini S L ensemble des analyses possibles s obtient par projection (composition) avec le lexique L Chaque règle exprime des restrictions sur les séquences licites d étiquettes, représentables par un automate fini R i L intersection des R i correspond à l ensemble des contraintes, et peut être optimisée (minimisation, déterminisation) Désambiguïser = S L ( T i R i) Implantations efficaces : 10K mots / secondes.

5 Apprendre par correction : l étiquetteur de Brill Apprentissage fondé sur des transformations (Transformation-based error-driven learning), guidé par les erreurs (Brill, 1995 ; de Loupy, 1995) Idée : Étiqueteur [E 0 ] très simple mais approximatif : l étiquette la plus probable (hors contexte). Apprendre itérativement des règles de correction des sorties de E 0 : E 1... E n Apprentissage par correction : vue d ensemble Texte brut Annotation intiale 1. Espace des transformations 2. Fonction d évaluation 3. Règles ordonnées Texte annoté Annotations correctes 1 2 Apprenti EBT Règles de correction 3

6 Règles de correction Règles de récriture changer l étiquette de Déterminant en Pronom si le mot suivant est un Verbe conjugué (6) Il/PRO la/det voit/v Il/PRO la/pro voit/v Espace des règles contextuelles changer l étiquette de a à b lorsque : le mot précédent (suivant) est étiqueté z le deuxième mot qui précède (suit) est étiqueté z l un des deux mots qui précèdent (suivent) est étiqueté z l un des trois mots qui précèdent (suivent) est étiqueté z le mot précédent est étiqueté z et le mot suivant est étiqueté w le mot précédent (suivant) est étiqueté z et le deuxième mot qui précède (suit) est étiqueté w

7 Exemples de règles (Winbrill) PRV:++ PREP WDNEXTTAG en ADJ:sg SBC:pl ADJ:pl PREV1OR2TAG SBC:pl PRO:sg PRV:sg PREVTAG - DTN:sg PRV:sg NEXTTAG ACJ:sg PRV:sg PRO:sg WDPREVTAG PREP elle VPAR:sg ADJ1PAR:sg PREV1OR2OR3TAG ECJ:sg DTN:pl PRV:pl LBIGRAM à les SUB$ SUB PREVTAG PREP VCJ:sg VPAR:sg PREV1OR2OR3TAG ACJ:sg ADJ:sg SBC:sg SURROUNDTAG DTN:sg PREP Espace des règles lexicales changer l étiquette de a à b lorsque : le mot courant (suivant) est z le mot courant est z et le mot précédent est w le mot courant est z et le mot suivant est v le suffixe de longueur k du mot courant est s le mot courant débute par une majuscule... Augmenter l espace des règles augmente la complexité de la recherche de la meilleure transformation!

8 Exemples de règles lexicales (Winbrill) e char SBC:sg s hassuf 1 SBC:pl it hassuf 2 VCJ:sg nt hassuf 2 VCJ:pl er hassuf 2 VNCFF NN i fchar SBC:sg * char SBP:sg 598 a hassuf 1 VCJ:sg 459 VCJ:pl ant fhassuf 3 VNCNT ment hassuf 4 ADV 323 un goodright SBC:sg je goodright VCJ:sg SBC:sg ez fhassuf 2 VCJ:pl 259 Apprendre par correction : les points forts + Acquisition automatique des règles + Obtient des résultats aussi bons que les méthodes probabilistes + en se contentant d un corpus d apprentissage beaucoup plus petit + Les règles sont compréhensibles, et peuvent être modifiées à la main + Nombre de règles moins élevé ( 100) + Implantations efficaces (combinaison de transducteurs)

9 Autres types d apprentissage Point de vue classification : mapping contexte une classe/l étiquette Plus proches voisins Régressions logistique / modèles maximum d entropie Séparateurs vaste marge (SVM) Point de vue transcodage : mapping Σ 1 Σ 2 probabilisation de Σ 1 Σ 2 (HMM) fonction de Sigma 1 vers Sigma 2 (CRFs) Etiqueteurs probabilistes : HMM et variantes Modèle probabiliste sur les séquences de couples (mot, étiquette) : p(m, E) M = w i 2 w i 1 w i mots E = e i 2 e i 1 e i étiquettes La meilleure décision E maximise : Hypothèses simplificatrices : p(e M) = p(m, E ) p(m) = p(e )p(m E) p(m) Les séquences d étiquettes sont Markoviennes d ordre k : p(e 1... e n ) = p(e 1 ) ky p(e i e i 1 ) à l ordre 2 i=1 L émission du mot w i ne dépend que de l étiquette courante p(w i e 1... e i, w 1... w i ) = p(w i e i ) paramètres du modèles : probabilités de transition p(e i e i k+1... e i 1 ) (n k c) probabilité d émission p(w j e i ) (n c n w )

10 Etiqueteurs probabilistes (suite) Implantation (Viterbi, Baum Welsch, Lissage) Etiqueteurs probabilistes (discussion) + Acquisition automatique des probabilités + Très bons résultats + Implantations efficaces (transducteurs pondérés) + De nombreuses variantes (modèles MaxEnt, Champs conditionnels aléatoires) - Grand nombre de «règles probabilistes» (paramètres) - Les raisons pour lesquelles l étiquetage fonctionne bien ou échoue sont très difficilement accessibles - plafonnement des performance ; il est difficile d analyser, de comprendre et d améliorer la capacité de ces approches à modéliser le comportement linguistique sous-jacent

11 Etiqueteurs du Français Xerox demos/ Input : La petite ferme du père Fouchard se trouve à la sortie du défilé. Résultats : La le +DET_SG petite petit +ADJ2_SG ferme ferme +NOUN_SG du de=le +PREP_DE père père +NOUN_SG Fouchard Fouchard +guessed+noun_inv se se +PC trouve trouver +VERB_P3SG à à +PREP_A la le +DET_SG sortie sortie +NOUN_SG Un exemple d utilisation TreeTagger/DecisionTreeTagger.html Créer un dossier TreeTagger, s y placer, et télécharger : les exécutables les scripts d étiquetages les ressources (dépendant de la langue) le script d installation Lancer l installation : sh install-tagger.sh lancer l étiquetage : cmd/tree-tagger-french fichier.txt >fichier.tt

12 Identification des groupes But : repérer des constituants linéaires : groupe nominal simple, noyau verbal, etc repérage des frontières étiquetage des groupes (par l étiquette de la tête) Intuition : rassembler les têtes (mots pleins) et leurs dépendants locaux verbe et auxiliaires, verbe et adverbes nom et déterminant adjectif et adverbes Applications : groupes de souffles (synthèse vocale) extraction de termes parsage robuste (énoncés bruités, etc). Approches du chunking Symboliques : spécification des patrons de groupes : GN DETADJ NNADJ implémentés par des transducteurs finis Numériques : tâche d étiquettage séquentiel Paul/NN ne/adv mange/vrb avec/prep plaisir/nn que/ B GN B GV I GV B GP I GP B mêmes techniques que pour POS

13 Quelques références CHANOD, J.-P. & TAPANAINEN, P. (1995). Statistical and constraint-based taggers for French. In Proc 7th EACL, Dublin, Ireland. SILBERZTEIN, M. (1993). Dictionnaires électroniques et analyse automatique de textes : le système INTEX. Paris : Masson. CHARNIAK E (1993). Statistical Language Learning, Cambridge : MIT Press (1993). BRILL, E. (1995). Transformation-based error-driven learning and naturallanguage processing : A case study in part-of-speech tagging. Computational Linguistics, 21(4), DE LOUPY, C. (1995). La méthode d Étiquetage d Eric Brill. Traitement Automatique des Langues, 36(1-2), HABERT, B., NAZARENKO, A. & SALEM, A. (1997). Les linguistiques de corpus. Paris : Armand Colin. ABNEY, S. Parsing (1996) : Partial Parsing via Finite-State Cascades, J. of Natural Language Engineering, 2(4) : Quelques implémantations libres acopost (acopost.sourceforge.net) : HMM, MaxEnt, Transformation-based learning (C) opennlp (sourceforge.net/projects/maxent/ : MaxEnt (python) Brill ( : implémentation originale de Brill

14 Etiquetage morphosyntaxique : une tâche emblématique problème quasi-résolu des méthodes d apprentissage sont très performantes un problème générique : assigner des catégories à des tokens identification des débuts/fins de phrase, de groupes syntaxiques identification des débuts/fins d entités nommées (noms de personnes, de lieux...)...

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

1 Description générale. Résumé

1 Description générale. Résumé Station Sensunique: une plateforme Web modulaire, collaborative et évolutive d acquisition assistée de ressources terminologiques et non terminologiques (orientée Langues Contrôlées) Izabella Thomas 1,

Plus en détail

Annotations manuelles et automatiques de corpus

Annotations manuelles et automatiques de corpus Annotations manuelles et automatiques de corpus Cyril Grouin cyril.grouin@limsi.fr 1 Définitions Base de données : ensemble structuré de données (feuille Excel). Id Ville Pays 01 Paris France 02 Dublin

Plus en détail

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus JEP-TALN 2004, Traitement Automatique de l Arabe, Fès, 20 avril 2004 Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus ZAAFRANI Riadh Faculté des Sciences Juridiques,

Plus en détail

UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES

UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES Chrystel Millon & Stéphanie Léon Equipe DELIC Université de Provence

Plus en détail

! Text Encoding Initiative

! Text Encoding Initiative Format XML: suite! le contenu d un élément est la concaténation de! texte! et d éléments (imbrication)! => structure arborescente! pas de chevauchement de balises! => exemple : une analyse syntagmatique

Plus en détail

Détection des propositions syntaxiques du français : en vue de l alignement des propositions de textes parallèles français-japonais

Détection des propositions syntaxiques du français : en vue de l alignement des propositions de textes parallèles français-japonais Détection des propositions syntaxiques du français : en vue de l alignement des propositions de textes parallèles français-japonais Yayoi Nakamura-Delloye To cite this version: Yayoi Nakamura-Delloye.

Plus en détail

(TALN) . Traitement Automatique du Langage Naturel. Outils d analyse de données textuelles. Laurent Audibert (LIPN - UMR CNRS 7030) 4 novembre 2010

(TALN) . Traitement Automatique du Langage Naturel. Outils d analyse de données textuelles. Laurent Audibert (LIPN - UMR CNRS 7030) 4 novembre 2010 Traitement Automatique du Langage Naturel (TALN) Outils d analyse de données textuelles Université Paris 13 Laboratoire d Informatique de Paris-Nord (LIPN) 4 novembre 2010 Problématique du TALN TALN :

Plus en détail

Trois approches du GREYC pour la classification de textes

Trois approches du GREYC pour la classification de textes DEFT 2008, Avignon (associé à TALN 08) Trois approches du GREYC pour la classification de textes Thierry Charnois Antoine Doucet Yann Mathet François Rioult GREYC, Université de Caen, CNRS UMR 6072 Bd

Plus en détail

MATHÉMATIQUES ET INFORMATIQUE

MATHÉMATIQUES ET INFORMATIQUE Premier volet : la théorie des langages 1 Christian Retoré 2 MATHÉMATIQUES ET INFORMATIQUE Les mathématiques de la linguistique computationnelle 1947, un grand millésime : à Jean-Yves Girard, Gérard Huet

Plus en détail

Application d un algorithme de traduction statistique à la normalisation de textos

Application d un algorithme de traduction statistique à la normalisation de textos Application d un algorithme de traduction statistique à la normalisation de textos Gabriel Bernier-Colborne 1 (1) Observatoire de linguistique Sens-Texte Université de Montréal gabriel.bernier-colborne@umontreal.ca

Plus en détail

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE

Plus en détail

FRENCH 3900- Language (Advanced Level III)

FRENCH 3900- Language (Advanced Level III) Professeur : Ivan Chow (ichow3@uwo.ca) Consultation : Par rendez-vous enligne ou par courriel Description générale du cours : FRENCH 3900- Language (Advanced Level III) grammaticale fournie dans & al.

Plus en détail

N 334 - SIMON Anne-Catherine

N 334 - SIMON Anne-Catherine N 334 - SIMON Anne-Catherine RÉALISATION D UN CDROM/DVD CONTENANT DES DONNÉES DU LANGAGE ORAL ORGANISÉES EN PARCOURS DIDACTIQUES D INITIATION LINGUISTIQUE A PARTIR DES BASES DE DONNÉES VALIBEL Introduction

Plus en détail

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot majuscu conjugaison >>>, L orthographe singulier syllabe virgule mémoire lettres et son enseignement graphie suffixe usage accent ; écrire féminin temps voyelles mot point Renforcer l enseignement de l

Plus en détail

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES Techniques symboliques de traitement automatique du langage pour l indexation thématique et l extraction d information temporelle Thèse Défense publique

Plus en détail

Apprentissage statistique dans les graphes et les réseaux sociaux

Apprentissage statistique dans les graphes et les réseaux sociaux Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique

Plus en détail

Ressources lexicales au service de recherche et d indexation des images

Ressources lexicales au service de recherche et d indexation des images RECITAL 2011, Montpellier, 27 juin - 1er juillet 2011 Ressources lexicales au service de recherche et d indexation des images Inga Gheorghita 1,2 (1) ATILF-CNRS, Nancy-Université (UMR 7118), France (2)

Plus en détail

GRIVEL Luc, GUILLEMIN-LANNE Sylvie, COUPET Pascal, HUOT Charles {luc.grivel, sylvie.guillemin-lanne, pascal.coupet, charles.huot} @temis-group.

GRIVEL Luc, GUILLEMIN-LANNE Sylvie, COUPET Pascal, HUOT Charles {luc.grivel, sylvie.guillemin-lanne, pascal.coupet, charles.huot} @temis-group. Analyse en ligne de l information : une approche permettant l extraction d informations stratégiques basée sur la construction de composants de connaissance GRIVEL Luc, GUILLEMIN-LANNE Sylvie, COUPET Pascal,

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr 1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Multi-catégorisation de textes juridiques et retour de pertinence

Multi-catégorisation de textes juridiques et retour de pertinence Multi-catégorisation de textes juridiques et retour de pertinence Vincent Pisetta, Hakim Hacid et Djamel A. Zighed article paru dans G. Ritschard et C. Djeraba (eds), Extraction et gestion des Connaissances

Plus en détail

Contemporary Engineering Sciences, Vol. 2, 2009, no. 4, 191-208

Contemporary Engineering Sciences, Vol. 2, 2009, no. 4, 191-208 Contemporary Engineering Sciences, Vol. 2, 2009, no. 4, 191-208 Conception d un Tuteur Intelligent en langage naturel français pour l enseignement de la modélisation conceptuelle des données d un système

Plus en détail

Évaluation de G-LexAr pour la traduction automatique statistique

Évaluation de G-LexAr pour la traduction automatique statistique TALN 2011, Montpellier, 27 juin 1 er juillet 2011 Évaluation de G-LexAr pour la traduction automatique statistique Wigdan Mekki (1), Julien Gosme (1), Fathi Debili (2), Yves Lepage (3), Nadine Lucas (1)

Plus en détail

LA CONJONCTION MÊME SI N EXISTE PAS!

LA CONJONCTION MÊME SI N EXISTE PAS! LA CONJONCTION MÊME SI N EXISTE PAS! Mireille Piot To cite this version: Mireille Piot. LA CONJONCTION MÊME SI N EXISTE PAS!. Christian Leclère, Eric Laporte, Mireille Piot et Max Silberztein éds. Benjamins,

Plus en détail

LEXOS, logiciel d'étude lexicale et de conjugaison

LEXOS, logiciel d'étude lexicale et de conjugaison 233, logiciel d'étude lexicale et de conjugaison Ce logiciel a été élaboré sous test constant, dans la mesure où, pour le modifier, je me suis inspiré en permanence de la réaction des élèves, de leurs

Plus en détail

1 On peut consulter et interroger ce corpus sur le site de l équipe DELIC : http://www.up.univmrs.fr/delic/crfp.

1 On peut consulter et interroger ce corpus sur le site de l équipe DELIC : http://www.up.univmrs.fr/delic/crfp. Ce que les corpus nous apprennent sur la langue Bilger Mireille (Université de Perpignan) - bilger@univ-perp.fr Cappeau Paul (Université de Poitiers) - Paul.Cappeau@univ-poitiers.fr La description syntaxique

Plus en détail

Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet

Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirilet RÉSUMÉÑÓ Ñ ºÑÓÖ ÙÒ Ú¹ Ú ÒÓÒº Ö ÓÖ ºÐ Ò Ö ÙÒ Ú¹ Ú ÒÓÒº Ö Mohamed Morid 1 Georges Linarès 1 (1) LIA-CERI, Université d Avignon

Plus en détail

TiLT : plate-forme pour le traitement automatique des langues naturelles

TiLT : plate-forme pour le traitement automatique des langues naturelles TiLT : plate-forme pour le traitement automatique des langues naturelles Johannes Heinecke * Grégory Smits ** Christine Chardenon * Emilie Guimier De Neef * Estelle Maillebuau * Malek Boualem * * Orange

Plus en détail

Tableau des contenus

Tableau des contenus Tableau des contenus Dossier 1 L image dans les relations amicales, sociales, professionnelles et amoureuses Dossier 2 Présenter quelqu un Je séduis. Parler de son rapport à l image. Caractériser des personnes

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

CONSTITUTION D'UN CORPUS D'ERREURS DU DACTYLOGRAPHE

CONSTITUTION D'UN CORPUS D'ERREURS DU DACTYLOGRAPHE CONSTITUTION D'UN CORPUS D'ERREURS DU DACTYLOGRAPHE Agnès Souque LIDILEM Université Stendhal Grenoble RÉSUMÉ La rédaction de textes sur ordinateur est aujourd'hui difficilement dissociable de l'utilisation

Plus en détail

Extraction automatique de terminologie à partir de libellés textuels courts

Extraction automatique de terminologie à partir de libellés textuels courts Extraction automatique de terminologie à partir de libellés textuels courts Jean-Claude Meilland ismart Le Mercure A, 565 Rue Berthelot 13851 Aix en Provence Cedex 3 (France) jean-claude.meilland@ismart.fr

Plus en détail

Luc Grivel (*, **) Luc.Grivel@univ-paris1.fr

Luc Grivel (*, **) Luc.Grivel@univ-paris1.fr MAITRISER LE PROCESSUS DE TEXT MINING DANS LE CADRE D APPLICATIONS D INTELLIGENCE ECONOMIQUE, DE GESTION DE LA RELATION CLIENT OU DE GESTION DE CONNAISSANCES Luc Grivel (*, **) Luc.Grivel@univ-paris1.fr

Plus en détail

TP 1. Prise en main du langage Python

TP 1. Prise en main du langage Python TP. Prise en main du langage Python Cette année nous travaillerons avec le langage Python version 3. ; nous utiliserons l environnement de développement IDLE. Étape 0. Dans votre espace personnel, créer

Plus en détail

ADAPT: un modèle de transcodage des nombres. Une application des systèmes de production au développement

ADAPT: un modèle de transcodage des nombres. Une application des systèmes de production au développement ADAPT: un modèle de transcodage des nombres Une application des systèmes de production au développement Référence Barrouillet, P., Camos, V., Perruchet, P., & Seron, X. (2004). A Developmental Asemantic

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

Interférences lexicales entre deux langues étrangères: anglais et français

Interférences lexicales entre deux langues étrangères: anglais et français Interférences lexicales entre deux langues étrangères: anglais et français Université de Marmara Résumé: Dans cet article, nous nous interrogerons sur les transferts lexicaux qui se réalisent entre l anglais

Plus en détail

Expériences de formalisation d un guide d annotation : vers l annotation agile assistée

Expériences de formalisation d un guide d annotation : vers l annotation agile assistée Expériences de formalisation d un guide d annotation : vers l annotation agile assistée Bruno Guillaume 1,2 Karën Fort 1,3 (1) LORIA 54500 Vandœuvre-lès-Nancy (2) Inria Nancy Grand-Est (3) Université de

Plus en détail

Traitement automatique des entités nommées en arabe : détection et traduction

Traitement automatique des entités nommées en arabe : détection et traduction Traitement automatique des entités nommées en arabe : détection et traduction Souhir Gahbiche-Braham Hélène Bonneau-Maynard François Yvon Université Paris Sud & LIMSI-CNRS BP 133-91403 ORSAY Cedex - France

Plus en détail

Formation Pédagogique 3h

Formation Pédagogique 3h Formation Pédagogique 3h Carole MOULIN Conseillère Pédagogique généraliste Bourgoin 2 20 mars 2013 Ecrire c est: Copier Ecrire sans erreurs sous la dictée Concevoir et écrire une phrase, des phrases, un

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

Extraction automatique de modèles de processus pour l étude de la résolution collective de problèmes dans les communautés du logiciel libre

Extraction automatique de modèles de processus pour l étude de la résolution collective de problèmes dans les communautés du logiciel libre Extraction automatique de modèles de processus pour l étude de la résolution collective de problèmes dans les communautés du logiciel libre Gabriel Ripoche 1,2 gripoche@uiuc.edu Les Gasser 1 gasser@uiuc.edu

Plus en détail

E-Gen : traitement automatique des offres d emploi

E-Gen : traitement automatique des offres d emploi 591 E-Gen : traitement automatique des offres d emploi Rémy Kessler 1, 2, Marc El-Bèze 1 1 Laboratoire Informatique d Avignon, BP 1228 F-84911 Avignon Cedex 9 FRANCE 2 AKTOR Interactive Parc Technologique

Plus en détail

Traitement bas-niveau

Traitement bas-niveau Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.

Plus en détail

PROJET DE FIN D ETUDES

PROJET DE FIN D ETUDES MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE ****** INSTITUT NATIONAL DES SCIENCES APPLIQUEES TOULOUSE Département de Génie Electrique & Informatique ****** PROJET DE FIN D ETUDES ROLE D UNE

Plus en détail

Compte-rendu de Hamma B., La préposition en français

Compte-rendu de Hamma B., La préposition en français Compte-rendu de Hamma B., La préposition en français Badreddine Hamma To cite this version: Badreddine Hamma. Compte-rendu de Hamma B., La préposition en français. Revue française de linguistique appliquée,

Plus en détail

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton Linked Open Data Le Web de données Réseau, usages, perspectives Sommaire Histoire du Linked Open Data Structure et évolution du réseau Utilisations du Linked Open Data Présence sur le réseau LOD Futurs

Plus en détail

CORRIGÉ DU DOSSIER N 2

CORRIGÉ DU DOSSIER N 2 Christian PUREN Professeur émérite de l Université de Saint-Étienne (France) Cours collaboratif en ligne «La didactique des langues-cultures comme domaine de recherche» http://www.christianpuren.com/cours-collaboratif-la-dlc-comme-domaine-de-recherche/

Plus en détail

ANALYSE SÉMANTICO-DISCURSIVE DES COLLOCATIONS LEXICALES EN CORPUS SPÉCIALISÉ : LA BASE CONNAISSANCE-S

ANALYSE SÉMANTICO-DISCURSIVE DES COLLOCATIONS LEXICALES EN CORPUS SPÉCIALISÉ : LA BASE CONNAISSANCE-S ANALYSE SÉMANTICO-DISCURSIVE DES COLLOCATIONS LEXICALES EN CORPUS SPÉCIALISÉ : LA BASE CONNAISSANCE-S Estelle Dubreil et Béatrice Daille LINA FRE CNRS 2729 Université de Nantes France Résumé : L association

Plus en détail

Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011. Atelier 1: Sphinx. import, conversion, export de données

Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011. Atelier 1: Sphinx. import, conversion, export de données Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011 Atelier 1: Sphinx import, conversion, export de données Introduction à la Recherche d'ist via le Web INRA Grignon, 03/2011

Plus en détail

La répétition de phrases comme aide au diagnostic des enfants dysphasiques C. Maillart*, A.L. Leclercq*, P. Quemart*

La répétition de phrases comme aide au diagnostic des enfants dysphasiques C. Maillart*, A.L. Leclercq*, P. Quemart* Entretiens de Bichat Orthophonie 2012 La répétition de phrases comme aide au diagnostic des enfants dysphasiques C. Maillart*, A.L. Leclercq*, P. Quemart* * Université de Liège, Unité de logopédie Clinique,

Plus en détail

Vers la correction automatique de textes bruités: Architecture générale et détermination de la langue d un mot inconnu

Vers la correction automatique de textes bruités: Architecture générale et détermination de la langue d un mot inconnu Vers la correction automatique de textes bruités: Architecture générale et détermination de la langue d un mot inconnu Marion Baranes To cite this version: Marion Baranes. Vers la correction automatique

Plus en détail

Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie

Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie TALN 25, Dourdan, 6 1 juin 25 Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie Florian Seydoux & Jean-Cédric Chappelier Faculté Informatique et Communications Ecole Polytechnique

Plus en détail

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École

Plus en détail

Prévalence et étiologie. Le retard mental : langage et communication. Définitions et classifications (2) Définitions et classifications

Prévalence et étiologie. Le retard mental : langage et communication. Définitions et classifications (2) Définitions et classifications Le retard mental : langage et communication M. - A. SCHELSTRAETE Unité CODE Prévalence et étiologie Prévalence: 25 / 1000 20 / 1000 déficience légère (QI > 50) 4-5 / 1000 déficience grave (QI < 50) = fréquence

Plus en détail

Créer un mémento grammatical portatif et évolutif pour tablettes et smartphones

Créer un mémento grammatical portatif et évolutif pour tablettes et smartphones Enseigner les Langues et Cultures de l Antiquité avec les TICE http://lettres.ac-dijon.fr TraAM travaux académiques mutualisés, un accompagnement au développement des usages des TIC Créer un mémento grammatical

Plus en détail

Méthode de classification des réponses d un moteur de recherche

Méthode de classification des réponses d un moteur de recherche SETIT 2005 3 rd International Conference: Sciences of Electronic, Technologies of Information and Telecommunications March 27-31, 2005 TUNISIA Méthode de classification des réponses d un moteur de recherche

Plus en détail

Etudes des échanges électroniques sur internet et intranet : forums et courriers électroniques

Etudes des échanges électroniques sur internet et intranet : forums et courriers électroniques Beaudouin V., Fleury S., Velkovska J. (2000). " Études des échanges électroniques sur internet et intranet : forums et courriers électroniques ". In M. Rajman & J.-C. Chappelier (éd), JADT 2000. 5emes

Plus en détail

LIVRET PERSONNEL DE COMPÉTENCES

LIVRET PERSONNEL DE COMPÉTENCES Nom... Prénom... Date de naissance... Note aux parents Le livret personnel de compétences vous permet de suivre la progression des apprentissages de votre enfant à l école et au collège. C est un outil

Plus en détail

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1 Chap 4: Analyse syntaxique 1 III- L'analyse syntaxique: 1- Le rôle d'un analyseur syntaxique 2- Grammaires non contextuelles 3- Ecriture d'une grammaire 4- Les méthodes d'analyse 5- L'analyse LL(1) 6-

Plus en détail

Abdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole

Abdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole ÉCOLE DOCTORALE SCIENCES ET TECHNOLOGIES (ORLEANS) FACULTÉ de TECHNOLOGIE (Sétif) Laboratoire PRISME THÈSE EN COTUTELLE INTERNATIONALE présentée par : Abdenour Hacine-Gharbi soutenue le : 09 décembre 2012

Plus en détail

Mode d emploi MD6000F

Mode d emploi MD6000F LE DICTIONNAIRE ÉLECTRONIQUE MULTIMÉDIA Mode d emploi MD6000F 2 Copyright Lexibook 2003 SOMMAIRE Page Page Introduction......................... 5 1. Caractéristiques générales.......... 5 1.1 Guide des

Plus en détail

fiche D AUTOCORRECTION Frimousse, une petite chienne qu'on a adoptée le mois dernier, est intelligente et docile.

fiche D AUTOCORRECTION Frimousse, une petite chienne qu'on a adoptée le mois dernier, est intelligente et docile. fiche D AUTOCORRECTION 3.4 Les accords sont corrects dans chaque groupe du nom. On met souvent sur le dos de l inattention les erreurs d orthographe grammaticale. Bien accorder les mots exige de l observation

Plus en détail

I. Le déterminant Il détermine le nom. Le déterminant indique le genre, le

I. Le déterminant Il détermine le nom. Le déterminant indique le genre, le I. Le déterminant Il détermine le nom. Le déterminant indique le genre, le nombre et le degré de détermination du nom. 1. L article le, la, les, l, d, au, aux, du, des, un, une, des, du, de l, de la, des.

Plus en détail

Atelier rédactionnel

Atelier rédactionnel Baccalauréat professionnel Gestion - Administration Atelier rédactionnel Exemples de séances réalisées en première et au début de l année de terminale Joëlle PERRETIER & Patrice VIRIEUX Lycée professionnel

Plus en détail

mes m est mets/met mais mets

mes m est mets/met mais mets GRAMMATICAUX DE CATÉGORIES DIFFÉRENTES MES HOMOPHONES M EST METS/MET MAIS METS 1 Homophones grammaticaux de catégories différentes mes m est mets/met mais mets mes : déterminant possessif pluriel, féminin

Plus en détail

Livret personnel de compétences

Livret personnel de compétences Livret personnel de compétences Grilles de références pour l évaluation et la validation des compétences du socle commun au palier 2 Janvier 2011 MENJVA/DGESCO eduscol.education.fr/soclecommun LES GRILLES

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

Grammaires d unification

Grammaires d unification Cours sur le traitement automatique des langues (IV) Violaine Prince Université de Montpellier 2 LIRMM-CNRS Grammaires d unification Grammaire catégorielle Grammaire syntagmatique généralisée (GPSG) Les

Plus en détail

La construction de composants de connaissance pour l extraction et le filtrage de l information sur les réseaux

La construction de composants de connaissance pour l extraction et le filtrage de l information sur les réseaux La construction de composants de connaissance pour l extraction et le filtrage de l information sur les réseaux une approche industrielle Grivel Luc, Guillemin-Lanne Sylvie, Lautier Christian, Mari Alda

Plus en détail

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues Maud Ehrmann Joint Research Centre Ispra, Italie. Guillaume Jacquet Xerox

Plus en détail

DEFT 09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique

DEFT 09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique DEFT 09 «DÉfi Fouille de Textes», Atelier de clôture, Paris, 22 juin 2009 DEFT 09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique

Plus en détail

La phonétisation de "plus", "tous" et de certains nombres : une analyse phono-syntaxique

La phonétisation de plus, tous et de certains nombres : une analyse phono-syntaxique La phonetisation de "plus", "tous" et de certains nombres. La phonétisation de "plus", "tous" et de certains nombres : une analyse phono-syntaxique Jean-Philippe Goldman, Christopher Laenzlinger et Eric

Plus en détail

Formation Actuaire Data Scientist. Programme au 24 octobre 2014

Formation Actuaire Data Scientist. Programme au 24 octobre 2014 Formation Actuaire Data Scientist Programme au 24 octobre 2014 A. Eléments logiciels et programmation Python 24h Objectif : Introduction au langage Python et sensibilisation aux grandeurs informatiques

Plus en détail

Dafoe Présentation de la plate-forme UIMA

Dafoe Présentation de la plate-forme UIMA Laboratoire d Informatique de l université Paris-Nord (UMR CNRS 7030) Institut Galilée - Université Paris-Nord 99, avenue Jean-Baptiste Clément 93430 Villetaneuse, France 11 juillet 2007 Plates-formes

Plus en détail

Caractéristiques du nom

Caractéristiques du nom DU MATÉRIEL NOM POUR ALLOPHONES 1 Nom et groupe nominal Caractéristiques du nom 1 LES CARACTÉRISTIQUES SÉMANTIQUES DU NOM Le nom commun désigne une personne ou une chose qui appartient à une même espèce.

Plus en détail

Modélisation d'une ontologie de domaine et des outils d'extraction de l'information associés pour l'anglais et le français

Modélisation d'une ontologie de domaine et des outils d'extraction de l'information associés pour l'anglais et le français Modélisation d'une ontologie de domaine et des outils d'extraction de l'information associés pour l'anglais et le français Nom : SERRANO Prénom : Laurie UFR des Sciences du Langage Mémoire de master 2

Plus en détail

Une approche de désambiguïsation morpho_lexicale évaluée sur l analyseur morphologique Alkhalil*

Une approche de désambiguïsation morpho_lexicale évaluée sur l analyseur morphologique Alkhalil* Une approche de désambiguïsation morpho_lexicale évaluée sur l analyseur morphologique Alkhalil* K.Z Bousmaha 1,2, S. Charef_Abdoun 1, L. Hadrich_Belguith 2, M.K Rahmouni 1 1Université d Oran, Faculté

Plus en détail

Réaliser un journal scolaire

Réaliser un journal scolaire Réaliser un journal scolaire 1/ Connaître le journal et ses contenus Pour que les élèves puissent à leur tour devenir producteurs, il faut absolument qu ils apprennent à connaître le journal et ses contenus.

Plus en détail

De la mesure à l analyse des risques

De la mesure à l analyse des risques De la mesure à l analyse des risques Séminaire ISFA - B&W Deloitte Jean-Paul LAURENT Professeur à l'isfa, Université Claude Bernard Lyon 1 laurent.jeanpaul@free.fr http://laurent.jeanpaul.free.fr/ 0 De

Plus en détail

e-recrutement : recherche de mots-clés pertinents dans le titre des annonces d emploi

e-recrutement : recherche de mots-clés pertinents dans le titre des annonces d emploi e-recrutement : recherche de mots-clés pertinents dans le titre des annonces d emploi Julie Séguéla 1, 2, Gilbert Saporta 1, Stéphane Le Viet 2 1 Laboratoire Cédric CNAM 292 rue Saint Martin 75141 Paris

Plus en détail

Évaluation transparente de systèmes de questions-réponses : application au focus

Évaluation transparente de systèmes de questions-réponses : application au focus RÉCITAL 2007, Toulouse, 5 8 juin 2007 Évaluation transparente de systèmes de questions-réponses : application au focus Sarra EL AYARI LIMSI-CNRS, BP 133, F-91403 ORSAY Sarra.ElAyari@limsi.fr Résumé. Les

Plus en détail

Projet de Master en Informatique: Web WriteIt!

Projet de Master en Informatique: Web WriteIt! Projet de Master en Informatique: Web WriteIt! Web WriteIt! Baris Ulucinar Supervisé par le Prof. Rolf Ingold, Dr. Jean Hennebert, Andreas Humm et Robert Van Kommer Avril 2007 Table des matières 2 1. Introduction

Plus en détail

Atelier ATOLL pour les grammaires d arbres adjoints

Atelier ATOLL pour les grammaires d arbres adjoints TALN 2001, Tours, 2-5 juillet 2001 Atelier ATOLL pour les grammaires d arbres adjoints François Barthélemy 1, Pierre Boullier 2, Philippe Deschamp 2, Linda Kaouane 2 et Éric Villemonte de la Clergerie

Plus en détail

Le traitement automatique des langues dans les industries de l'information

Le traitement automatique des langues dans les industries de l'information Le traitement automatique des langues dans les industries de l'information Livre blanc Groupe de Réflexion sur les Industries de l Information et les Industries de la Langue (GRIIIL) Janvier 2005 Avant-propos

Plus en détail

Algorithmes d'apprentissage

Algorithmes d'apprentissage Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt

Plus en détail

pythonocc: une plateforme de développement agile d applications CAO.

pythonocc: une plateforme de développement agile d applications CAO. pythonocc: une plateforme de développement agile d applications CAO. PyConFR 2009 Cité des Sciences et de l Industrie, Paris Thomas Paviot*, Jelle Feringa* *pythonocc project: tpaviot@gmail.com; jelleferinga@gmail.com

Plus en détail

La traduction automatique des articles de l anglais au français

La traduction automatique des articles de l anglais au français Université de Gand Faculté de Philosophie et Lettres Année universitaire 2012-2013 La traduction automatique des articles de l anglais au français Lissa Catthoor Mémoire de master présenté en vue de l

Plus en détail

Le modèle standard, SPE (1/8)

Le modèle standard, SPE (1/8) Le modèle standard, SPE (1/8) Rappel : notion de grammaire mentale modulaire Les composants de la grammaire : module phonologique, sémantique syntaxique Syntaxe première : elle orchestre la relation mentale

Plus en détail

Laboratoire d Informatique, de Traitement de l Information et des Systèmes EA 4108. 3 établissements T. Paquet D. Olivier T. Lecroq A.

Laboratoire d Informatique, de Traitement de l Information et des Systèmes EA 4108. 3 établissements T. Paquet D. Olivier T. Lecroq A. Laboratoire d Informatique, de Traitement de l Information et des Systèmes EA 4108 3 établissements T. Paquet D. Olivier T. Lecroq A. Benshrair 7 équipes Disciplines 27-61, 25-26-43-64 L. Heutte DocApp

Plus en détail

Boléro. d information. Notice

Boléro. d information. Notice Notice Boléro d information Boléro est construit dans la perspective d un investissement sur la durée totale de la formule et donc d un rachat aux dates d échéances indiquées. Tout rachat de part à d autres

Plus en détail

Homophones grammaticaux de catégories différentes. ce se

Homophones grammaticaux de catégories différentes. ce se GRAMMATICAUX DE CATÉGORIES DIFFÉRENTES CE HOMOPHONES SE 1 Homophones grammaticaux de catégories différentes ce se ce : déterminant démonstratif masculin singulier. Il fait partie d un GN dont le noyau

Plus en détail

Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos

Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos Laurent Veillard UMR ICAR (CNRS, Université Lyon 2, ENS de lyon)

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Le nous du général de Gaulle

Le nous du général de Gaulle Le nous du général de Gaulle Dominique Labbé To cite this version: Dominique Labbé. Le nous du général de Gaulle. Quaderni di studi linguistici, 1998, 4/5, pp.331-354. HAL Id: halshs-00675362

Plus en détail

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations U Université dumaine Faculté des Lettres, Langues et Sciences humaines Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations Carole Lailler 1 L interrogation : une modalité

Plus en détail

Tableau mettant en relation les niveaux du CECRL et les programmes IFALPES par compétences.

Tableau mettant en relation les niveaux du CECRL et les programmes IFALPES par compétences. Tableau mettant en relation les niveaux du CCRL et les programmes IFALPS par compétences. A1 CCRL CONTNU DU PROGRAMM A1 IFALPS Compréhension orale. C Des formules de politesse et de salutation O Je peux

Plus en détail

Observatoire des ressources numériques adaptées

Observatoire des ressources numériques adaptées Observatoire des ressources numériques adaptées INS HEA 58-60 avenue des Landes 92150 Suresnes orna@inshea.fr IDENTIFIANT DE LA FICHE Y'a pas photo DATE DE PUBLICATION DE LA FICHE Mars 2015 MOT -CLE LIBRE

Plus en détail