De l étiquetage morpho-syntaxique au super-chunking: levée d ambiguités à l aide de méthodes hybrides et de ressources lexicales riches
|
|
- Edgar Laviolette
- il y a 7 ans
- Total affichages :
Transcription
1 De l étiquetage morpho-syntaxique au super-chunking: levée d ambiguités à l aide de méthodes hybrides et de ressources lexicales riches De l étiquetage morpho-syntaxique au super-chunking: levée d ambiguités à l aide de méthodes hybrides et de ressources lexicales riches Université Paris-Est Marne-la-Vallée 4 septembre 2009 De l étiquetage morpho-syntaxique au super-chunking: levée d ambiguité
2 Points Importants Points Importants Experiences sur l étiquetage morpho-syntaxique : Hybridation, intégration de modules de désambiguisation statistiques et symboliques (Elag). Prise en compte de données linguistiques lors de l étiquetage, en particulier les mots composés. Experiences sur l analyse syntaxique partielle, chunking. Hybridation, utilisation d un module de désambiguisation statistique en sortie d un super-chunker, Pom.
3 Table des matières Table des matières 1 Points Importants 2 Table des matières 3 introduction et définitions : étiquetage morpho-syntaxique introduction et définitions : état de l art Corpus annoté du Français Principe général de l étiqueteur Algorithmes de désambiguisation Évaluations 4 Analyse syntaxique partielle introduction et définitions : chunking introduction et définitions : état de l art Principe général du chunker Évaluations 5 Perspectives 6 Bibliographie
4 introduction et définitions : étiquetage morpho-syntaxique Étiquetage morpho-syntaxique L étiquetage morpho-syntaxique d un texte (Part-Of-Speech en anglais) consiste à assigner à chaque mot d un texte une étiquette morpho-syntaxique. Une étiquette morpho-syntaxique décrit : catégorie grammaticale : nom N, verbe V, adjectif A,... informations morphologiques : genre :masculin m, féminin f nombre : pluriel p, singulier s temps : imparfait I, présent P,... Exemple phrase = Max a mangé une pomme étiquettes = {N,V,DET} en sortie : Max.N a.v mangé.v une.det pomme.n
5 introduction et définitions : étiquetage morpho-syntaxique Problème : Les mots de la langue sont ambigüs. On peut parfois assigner plusieurs étiquettes morpho-syntaxiques à un mot donné de la phrase. Exemple texte tokénisé = je le, bois lexique = { je.pro, le.det, le.pro, bois.n, bois.v }
6 introduction et définitions : état de l art Levée d ambiguités : La désambiguisation de l automate du texte consiste en la recherche du meilleur chemin décrit par cet automate. C est à dire pour chaque mot du texte, choisir l étiquette morpho-syntaxique la plus pertinente au regard du contexte de ce mot. Plusieurs approches : approches statistiques : à base de probabilités : Hmm,TreeTagger,SVM,... utilisant des modèles de règles : Brill l apprentissage est fait sur un corpus annoté manuellement, nécessite un coût humain de création approche symbolique : les règles sont construites manuellement, nécessite un coût humain de création Elag,... approche hybride : combinaison des deux approches, symbolique et statistique approche étudiée
7 introduction et définitions : état de l art Étiqueteurs évalués sur l anglais : SVMTOOL : 97,20% sur le corpus Wall-Street Journal (37 étiquettes) Tree-Tagger : 96,36% sur le corpus Penn-TreeBank (36 étiquettes) Brill Tagger : 96% Innovations La plupart des étiqueteurs utilisent une approche statistique ou une approche symbolique, mais peu une méthode hybride. Peu d étiqueteurs prennent en compte les mots composés dans le processus d étiquetage.
8 Corpus annoté du Français Corpus annoté Pour l approche statistique de la désambiguisation, nous avons besoin d un corpus annoté du Français. Corpus arboré d Anne Abeillé issu du journal Le Monde (environ mots). Le choix s est porté sur le corpus d Anne Abeillé pour plusieurs raisons : découpage du texte en token-mots informations morpho-syntaxiques sur chaque token-mot repérage des mots composés découpage du texte en chunks Exemple (XN) (w cat= DET mph= ms lemma= le ) le (/w) (w cat= A mph= ms lemma= deuxième ) deuxième (/w) (w cat= N mph= ms lemma= problème ) problème (/w) (/XN)
9 Principe général de l étiqueteur Architecture de l étiqueteur Architecture composée de trois principaux modules : expériences de désambiguisation statistique : DelPaths, suppression de chemins à l aide de mots composés. AddPaths, ajout de chemins étiquetés à l aide de mots composés. Learning Errors, règles contextuelles et lexicales désambiguiseur symbolique ELAG. linéarisation faite par un désambiguiseur statistique probabiliste basé sur les modèles de Markov cachés (HMM).
10 Principe général de l étiqueteur Modèle probabiliste HMM But : Trouver la meilleur séquence d étiquettes t pour toute séquence w de token-mots d une phrase d un texte : argmax(p(w/t)) Exemple phrase du texte = il a mangé lexique = il.pro, a.n, a.v, mangé.v chemins possibles : il.pro a.n mangé.v P(il a mangé/pro N V) = il.pro a.v mangé.v P(il a mangé/pro V V) = meilleur chemin : il.pro a.v mangé.v Problème : temps de calcul exponentiel Solution : Algorithme dynamique de Viterbi, compléxité réduite O(n 2 )
11 Algorithmes de désambiguisation Intuition Les mots composés ont plus de poids dans l automate que les mots simples. journal télévisé.n+na a plus de poids que journal puis télévisé. Problème On ne peut utiliser les mots composés en sortie de l étiquetage mais on s en sert pour traiter les mots simples. Ceci dans le but de comparer avec les étiqueteurs actuels.
12 Algorithmes de désambiguisation DelPaths Supprime des chemins de mots simples en concurrence avec des mots composés en parallèles. AddPaths Ajoute des chemins de mots simples dans l automate étiquetés par les noms composés. Le réétiquetage est aussi fait dans le corpus d apprentissage.
13 Algorithmes de désambiguisation Learning Errors Crée automatiquement des règles lexicales et contextuelles à partir d erreurs d étiquetages initiales. On étiquete basiquement le corpus d apprentissage avec l étiqueteur. Ensuite on récupère la liste des erreurs d étiquetage et pour chaque mot, on récupère des informations : Lexicales, catégories grammaticales + fréquences contextuelles, contextes gauches et droits fréquents Puis avec ces informations, on crée automatiquement des règles applicables sur l automate ambigü du texte. Exemple Règle lexicale : aussi est souvent associé à ADV Règle contextuelle : ce.pro a souvent un contexte droit PRO
14 Algorithmes de désambiguisation ELAG ensemble de grammaires définissant des règles contextuelles et lexicales écrites manuellement. Exemple si.adv existe si et seulement si le contexte droit est une des catégories, ADV, A, V :K, début de phrase ou ponctuation. elle est si.adv belle.a si.adv intimement.adv Si tel n est pas le cas alors l ambiguité si.adv est supprimée de l automate du texte.
15 Évaluations Jeu d étiquettes simple(catégorie grammaticale) : Étiqueteur mots connus mots inconnus total HmmTagger (basic) 95,56 92,16 95,41 HmmTagger 96,23 93,76 96,13 TreeTagger 96,58 87,33 96,19 SVMTOOL 97,81 92,04 97,58 Jeu d étiquettes complexe (catégorie + traits) : Étiqueteur mots connus mots inconnus total HmmTagger (basic) 92,45 90,39 92,40 HmmTagger 93,53 90,21 93,40 TreeTagger 93,44 8,81 89,91 SVMTOOL 94,78 85,40 94,40 Évaluation de l étiqueteur selon l utilisation indépendante de chaque module de désambiguisation
16 Analyse syntaxique partielle introduction et définitions : chunking Chunking/Super-Chunking L Analyse syntaxique partielle, ou chunking, consiste à découper la phrase en séquences de mots, que l on appelera chunks, auxquelles on attribue une classe grammaticale : chunks nominaux XN : la jolie pomme, le pantalon,... chunks prépositionnels XP : sur la colline, de la terre, Exemple phrase = Brill vit l homme sur la colline étiquettes = {XN,XV,XP} en sortie : [XN Brill][XV vit][xn l homme][xp sur la colline] Le super-chunking prend en compte les unités multi-mots (mots composés, expressions figées,...). Exemple chunks = [XN le cordon][xa bleu] en sortie : [XN le cordon bleu]
17 Analyse syntaxique partielle introduction et définitions : état de l art Levée d ambiguités : Plusieurs approches : approches statistiques : On effecte un étiquetage morpho-syntaxique du texte. Avec les étiquettes, on fait l analyse en chunks (grâce aux HMM). l apprentissage est fait sur un corpus annoté. Exemple : Skut, Molina,... approche symbolique : Résolution par cascade de transducteurs (des grammaires). Chacun des transducteurs permet de reconnaître un type de chunk particulier. Exemple : Pom, Abney, Macaon,... approche hybride : combinaison des deux approches, symbolique et statistique. approche étudiée. Les résultats en général de ces chunkers sont d environ 90% de chunks bien segmentés et bien étiquetés (sur l Anglais).
18 Analyse syntaxique partielle Principe général du chunker Architecture du super-chunker Pom Utilisation du module de désambiguisation statistique probabiliste (HMM) aux différentes sorties ayant un automate ambigü. Recherche de la meilleure position du module.
19 Analyse syntaxique partielle Évaluations Les évaluations ont porté sur le corpus d évaluation crée par Takuya Nakamura et Stavroula Voyatzi : 3336 chunks répartis dans 453 phrases. algorithme rappel précision Pom 81,73 77,86 Pom+StatProb 83,54 79,54 Couverture des analyses : 53,87% Couverture des chunks : 88,84% En focalisant sur les chunks : chunk chunks trouvés total dans le corpus pourcentage XN ,62 XV ,61 XP ,23 XADV ,12 XA ,68 det,conjc,conjs, ,32
20 Perspectives Ajout des lemmes dans les étiquettes morpho-syntaxiques. Ajout de règles ELAG. Adapter et évaluer notre étiqueteur sur un corpus Anglais. Analyse syntaxique partielle Transformer Pom en chunker standard et évaluer sur le corpus d Anne Abeillé. Implémenter et évaluer un super-chunker se basant sur une approche uniquement statistique utilisant notre étiqueteur morpho-syntaxique.
21 Bibliographie Anne Abeillé, Lionel Clément, Un corpus français arboré : quelques interrogations. Christopher D. Manning, Hinrich Schütze, Foundations of Statistical Natural Language Processing, MIT. Éric Laporte, Anne Monceaux, Elimination of lexical ambiguities by grammars. The ELAG system Éric Brill, A Simple Rule-Based Part of Speech Tagger Jesus Giménez, Lluis Marquez, SVMTool : A general POS tagger generator based on Support Vector Machines Olivier Blanc, Matthieu Constant and Patrick Watrin Segmentation in super-chunks with a finite-state approach Helmut Schmid Probabilistic part-of-speech tagging using decision trees Antonio Molina and Ferran Pla Shallow parsing using specialized HMMs. J. of Machine Learning Research 2 : pp
22 Bibliographie FIN
Apprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailIntelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Plus en détail1 Description générale. Résumé
Station Sensunique: une plateforme Web modulaire, collaborative et évolutive d acquisition assistée de ressources terminologiques et non terminologiques (orientée Langues Contrôlées) Izabella Thomas 1,
Plus en détail! Text Encoding Initiative
Format XML: suite! le contenu d un élément est la concaténation de! texte! et d éléments (imbrication)! => structure arborescente! pas de chevauchement de balises! => exemple : une analyse syntagmatique
Plus en détailTD 1 - Structures de Traits et Unification
TD 1 - Structures de Traits et Unification 1 Définitions Un trait (en: feature) est un couple attribut-valeur. Une structure de traits (en: feature structure) est un ensemble de traits. On peut les représenter
Plus en détailADAPT: un modèle de transcodage des nombres. Une application des systèmes de production au développement
ADAPT: un modèle de transcodage des nombres Une application des systèmes de production au développement Référence Barrouillet, P., Camos, V., Perruchet, P., & Seron, X. (2004). A Developmental Asemantic
Plus en détailChap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1
Chap 4: Analyse syntaxique 1 III- L'analyse syntaxique: 1- Le rôle d'un analyseur syntaxique 2- Grammaires non contextuelles 3- Ecriture d'une grammaire 4- Les méthodes d'analyse 5- L'analyse LL(1) 6-
Plus en détailDétection des propositions syntaxiques du français : en vue de l alignement des propositions de textes parallèles français-japonais
Détection des propositions syntaxiques du français : en vue de l alignement des propositions de textes parallèles français-japonais Yayoi Nakamura-Delloye To cite this version: Yayoi Nakamura-Delloye.
Plus en détailEcole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011. Atelier 1: Sphinx. import, conversion, export de données
Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011 Atelier 1: Sphinx import, conversion, export de données Introduction à la Recherche d'ist via le Web INRA Grignon, 03/2011
Plus en détailfiche D AUTOCORRECTION Frimousse, une petite chienne qu'on a adoptée le mois dernier, est intelligente et docile.
fiche D AUTOCORRECTION 3.4 Les accords sont corrects dans chaque groupe du nom. On met souvent sur le dos de l inattention les erreurs d orthographe grammaticale. Bien accorder les mots exige de l observation
Plus en détailCONSTITUTION D'UN CORPUS D'ERREURS DU DACTYLOGRAPHE
CONSTITUTION D'UN CORPUS D'ERREURS DU DACTYLOGRAPHE Agnès Souque LIDILEM Université Stendhal Grenoble RÉSUMÉ La rédaction de textes sur ordinateur est aujourd'hui difficilement dissociable de l'utilisation
Plus en détailAnnotations manuelles et automatiques de corpus
Annotations manuelles et automatiques de corpus Cyril Grouin cyril.grouin@limsi.fr 1 Définitions Base de données : ensemble structuré de données (feuille Excel). Id Ville Pays 01 Paris France 02 Dublin
Plus en détailUn dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus
JEP-TALN 2004, Traitement Automatique de l Arabe, Fès, 20 avril 2004 Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus ZAAFRANI Riadh Faculté des Sciences Juridiques,
Plus en détailGrammaires d unification
Cours sur le traitement automatique des langues (IV) Violaine Prince Université de Montpellier 2 LIRMM-CNRS Grammaires d unification Grammaire catégorielle Grammaire syntagmatique généralisée (GPSG) Les
Plus en détailTraitement bas-niveau
Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.
Plus en détailmajuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot
majuscu conjugaison >>>, L orthographe singulier syllabe virgule mémoire lettres et son enseignement graphie suffixe usage accent ; écrire féminin temps voyelles mot point Renforcer l enseignement de l
Plus en détailmes m est mets/met mais mets
GRAMMATICAUX DE CATÉGORIES DIFFÉRENTES MES HOMOPHONES M EST METS/MET MAIS METS 1 Homophones grammaticaux de catégories différentes mes m est mets/met mais mets mes : déterminant possessif pluriel, féminin
Plus en détailRecherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA
RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE
Plus en détailÉvaluation et implémentation des langages
Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation
Plus en détailApprentissage statistique dans les graphes et les réseaux sociaux
Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique
Plus en détailMinistère des Affaires étrangères et européennes. Direction de la politique culturelle et du français. Regards VII
Ministère des Affaires étrangères et européennes Direction de la politique culturelle et du français Regards VII 8. Les voitures électriques Réalisation Thomas Sorin, CAVILAM Rédaction Frédérique Gella,
Plus en détailHadopi Département Recherche, Etudes et Veille (DREV)
Hadopi Département Recherche, Etudes et Veille (DREV) Livre numérique et terminaux de lecture, quels usages? note d analyse Dans le cadre de la mission légale d observation des utilisations licites et
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailJADT 2010-11/06/2010 Rome Utilisation de la visualisation en nuage arboré pour l'analyse littéraire
JADT 2010-11/06/2010 Rome Utilisation de la visualisation en nuage arboré pour l'analyse littéraire Delphine Amstutz (CELLF Université Paris-Sorbonne Paris 4 / CNRS) Philippe Gambette (LIRMM Université
Plus en détailAtelier rédactionnel
Baccalauréat professionnel Gestion - Administration Atelier rédactionnel Exemples de séances réalisées en première et au début de l année de terminale Joëlle PERRETIER & Patrice VIRIEUX Lycée professionnel
Plus en détailLe verbe avoir (to have) infinitif = avoir. j ai nous avons tu as vous avez. Exemples: J ai une copine à Montréal.
Leçon 7 - La Vie est belle La vie de Nafi, une jeune Française d origine sénégalaise parle de sa vie. Elle est étudiante en sociologie à l Université de Toulouse. Aujourd hui, elle parle de sa vie. -Est-ce
Plus en détailThéorie des Langages
Théorie des Langages Analyse syntaxique descendante Claude Moulin Université de Technologie de Compiègne Printemps 2010 Sommaire 1 Principe 2 Premiers 3 Suivants 4 Analyse 5 Grammaire LL(1) Exemple : Grammaire
Plus en détailPrésentation du Master Ingénierie Informatique et du Master Science Informatique 2007-2008, Année 2 Université Paris-Est Marne-la-Vallée
Présentation du Master Ingénierie Informatique et du Master Science Informatique 2007-2008, Année 2 Université Paris-Est Marne-la-Vallée Responsable du Master Informatique : Marc Zipstein Responsable de
Plus en détailIFT 6261: L Analytique Web. Fares Aldik, Consultant principal, Analytique Web et optimisation Bell Marchés Affaires services d expérience client
IFT 6261: L Analytique Web Fares Aldik, Consultant principal, Analytique Web et optimisation Bell Marchés Affaires services d expérience client 2012 01 04 Analytique Web : une pratique multidisciplinaire
Plus en détailExpression des contraintes. OCL : Object C o n t r a i n t L a n g u a g e
P r o b l é m a t i q u e OCL : O b j e c t C o n s t r a i n t L a n g u a g e Le langage de contraintes d UML Les différents diagrammes d UML permettent d exprimer certaines contraintes graphiquement
Plus en détailDécompresser, créer une archive au format «ZIP»
Décompresser, créer une archive au format «ZIP» Qu'est-ce qu'une archive? Une archive est tout simplement une collection de fichiers stockée dans un fichier unique. Rien de plus, rien de moins. Il existe
Plus en détailUnité 6. Qu est ce que tu prends au petit au petit déjeuner?
L'amitié Unité 6 Qu est ce que tu prends au petit au petit déjeuner? 1) Ecoute la maîtresse et coche 2) Complète avec : un jus d orange de la confiture un chocolat du beurre du thé un gâteau du café des
Plus en détailCompléments de documentation Scilab : affichage de texte et formatage de nombres
Université des Sciences et Technologies de Lille U.F.R. de Mathématiques Pures et Appliquées Agrégation externe Année 2002-2003 Compléments de documentation Scilab : affichage de texte et formatage de
Plus en détailAtelier ATOLL pour les grammaires d arbres adjoints
TALN 2001, Tours, 2-5 juillet 2001 Atelier ATOLL pour les grammaires d arbres adjoints François Barthélemy 1, Pierre Boullier 2, Philippe Deschamp 2, Linda Kaouane 2 et Éric Villemonte de la Clergerie
Plus en détailPour écrire un texte sans fautes
Module d éducation au préscolaire et d enseignement au primaire Projet pilote CommUniQ. Pour écrire un texte sans fautes Écrire un texte est une activité exigeante, ce qui est normal, puisque c est une
Plus en détailMorphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations
U Université dumaine Faculté des Lettres, Langues et Sciences humaines Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations Carole Lailler 1 L interrogation : une modalité
Plus en détailTEXT MINING. 10.6.2003 1 von 7
TEXT MINING 10.6.2003 1 von 7 A LA RECHERCHE D'UNE AIGUILLE DANS UNE BOTTE DE FOIN Alors que le Data Mining recherche des modèles cachés dans de grandes quantités de données, le Text Mining se concentre
Plus en détailson sont SON HOMOPHONES LES EXERCICES DE FRANÇAIS DU CCDMD www.ccdmd.qc.ca Homophones grammaticaux de catégories différentes
GRAMMATICAUX DE CATÉGORIES DIFFÉRENTES SON HOMOPHONES SONT 1 Homophones grammaticaux de catégories différentes son sont son : sont : déterminant possessif singulier à la 3 e personne. Il fait partie d
Plus en détailUTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES
UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES Chrystel Millon & Stéphanie Léon Equipe DELIC Université de Provence
Plus en détailUne approche de désambiguïsation morpho_lexicale évaluée sur l analyseur morphologique Alkhalil*
Une approche de désambiguïsation morpho_lexicale évaluée sur l analyseur morphologique Alkhalil* K.Z Bousmaha 1,2, S. Charef_Abdoun 1, L. Hadrich_Belguith 2, M.K Rahmouni 1 1Université d Oran, Faculté
Plus en détail«La pomme qui voulait voyager»
«La pomme qui voulait voyager» Création d'une suite d histoire à partir d une séquence d'images Type d outil : Démarche d apprentissage en contagion et en construction de langage (Savoir Parler). Auteurs
Plus en détailFormation Pédagogique 3h
Formation Pédagogique 3h Carole MOULIN Conseillère Pédagogique généraliste Bourgoin 2 20 mars 2013 Ecrire c est: Copier Ecrire sans erreurs sous la dictée Concevoir et écrire une phrase, des phrases, un
Plus en détailNom de l application
Ministère de l Enseignement Supérieur et de la Recherche Scientifique Direction Générale des Etudes Technologiques Institut Supérieur des Etudes Technologiques de Gafsa Département Technologies de l Informatique
Plus en détailPlan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation
Complex Event Processing Traitement de flux de données en temps réel Romain Colle R&D Project Manager Quartet FS Plan Génération et exploitation de données CEP et applications Flux de données et notifications
Plus en détailParcours DIWEB : (Données, Interaction et Web)
Parcours DIWEB : (Données, Interaction et Web) Semestre 2 (et vue sur le M2) Pierre Pompidor Faculté des Sciences Novembre 2010 Pierre Pompidor (Université Montpellier 2) Master Informatique - Spécialité
Plus en détailCompte-rendu de Hamma B., La préposition en français
Compte-rendu de Hamma B., La préposition en français Badreddine Hamma To cite this version: Badreddine Hamma. Compte-rendu de Hamma B., La préposition en français. Revue française de linguistique appliquée,
Plus en détailLA CONJONCTION MÊME SI N EXISTE PAS!
LA CONJONCTION MÊME SI N EXISTE PAS! Mireille Piot To cite this version: Mireille Piot. LA CONJONCTION MÊME SI N EXISTE PAS!. Christian Leclère, Eric Laporte, Mireille Piot et Max Silberztein éds. Benjamins,
Plus en détailMANUEL UTILISATEUR DU SITE D INSCRIPTIONS FCL1.028 DGAC POUR LES CANDIDATS AUX CONTROLES DE COMPETENCES LINGUISTIQUES LANGUE ANGLAISE ORGANISES PAR LA
Page : 1/15 MANUEL UTILISATEUR DU SITE D INSCRIPTIONS POUR LES CANDIDATS AUX CONTROLES DE COMPETENCES LINGUISTIQUES LANGUE ANGLAISE FCL1.028 ORGANISES PAR LA DGAC Page : 2/15 TABLE DES MATIERES 1. Principe
Plus en détailÉvaluation de G-LexAr pour la traduction automatique statistique
TALN 2011, Montpellier, 27 juin 1 er juillet 2011 Évaluation de G-LexAr pour la traduction automatique statistique Wigdan Mekki (1), Julien Gosme (1), Fathi Debili (2), Yves Lepage (3), Nadine Lucas (1)
Plus en détailTrois approches du GREYC pour la classification de textes
DEFT 2008, Avignon (associé à TALN 08) Trois approches du GREYC pour la classification de textes Thierry Charnois Antoine Doucet Yann Mathet François Rioult GREYC, Université de Caen, CNRS UMR 6072 Bd
Plus en détailManuel d utilisation du prototype d étiquetage et première expérimentation (fin 2008)
Manuel d utilisation du prototype d étiquetage et première expérimentation (fin 008) Julien Legueries 1 Installation Le prototype est constitué d une archive Java (fichier jar), d un fichier de propriétés
Plus en détailISO/CEI 11172-3 NORME INTERNATIONALE
NORME INTERNATIONALE ISO/CEI 11172-3 Première édition 1993-08-01 Technologies de l information - Codage de l image animée et du son associé pour les supports de stockage numérique jusqu à environ Ii5 Mbit/s
Plus en détailIFT2255 : Génie logiciel
IFT2255 : Génie logiciel Chapitre 6 - Analyse orientée objets Section 1. Introduction à UML Julie Vachon et Houari Sahraoui 6.1. Introduction à UML 1. Vers une approche orientée objet 2. Introduction ti
Plus en détailLES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN
LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas
Plus en détailLa phonétisation de "plus", "tous" et de certains nombres : une analyse phono-syntaxique
La phonetisation de "plus", "tous" et de certains nombres. La phonétisation de "plus", "tous" et de certains nombres : une analyse phono-syntaxique Jean-Philippe Goldman, Christopher Laenzlinger et Eric
Plus en détailLe code à barres EAN 13 mes premiers pas...
Le code à barres EAN 13 mes premiers pas... k étape 1 Vous venez d adhérer à GS1 France, Vous souhaitez connaître les démarches à suivre pour mettre en place un code à barres sur vos emballages. Ce guide
Plus en détailLa NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.
La NP-complétude Johanne Cohen PRISM/CNRS, Versailles, France. Références 1. Algorithm Design, Jon Kleinberg, Eva Tardos, Addison-Wesley, 2006. 2. Computers and Intractability : A Guide to the Theory of
Plus en détailTiLT : plate-forme pour le traitement automatique des langues naturelles
TiLT : plate-forme pour le traitement automatique des langues naturelles Johannes Heinecke * Grégory Smits ** Christine Chardenon * Emilie Guimier De Neef * Estelle Maillebuau * Malek Boualem * * Orange
Plus en détailLangue, techniques de rédaction et correction d épreuves (412-2A1-LG)
Langue, techniques de rédaction et correction d épreuves (412-2A1-LG) Programme : Services paralangagiers (Recherche documentaire en traduction) Plan de cours Introduction Frais d inscription Ce cours
Plus en détailContemporary Engineering Sciences, Vol. 2, 2009, no. 4, 191-208
Contemporary Engineering Sciences, Vol. 2, 2009, no. 4, 191-208 Conception d un Tuteur Intelligent en langage naturel français pour l enseignement de la modélisation conceptuelle des données d un système
Plus en détailProposition de séquence collège/lycée. Niveau A2 A2+
Proposition de séquence collège/lycée Niveau A2 A2+ Titre : De vacaciones! Le professeur présentera les objectifs de la séquence afin de donner du sens aux apprentissages. Il pourra donner la tâche finale
Plus en détailCréation d un formulaire de contact Procédure
Création d un formulaire de contact Procédure Description : Cette procédure explique en détail la création d un formulaire de contact sur TYPO3. Outil Procédure CMS: TYPO3 Auteur : hemmer.ch SA Extension:
Plus en détailACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES
ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES Techniques symboliques de traitement automatique du langage pour l indexation thématique et l extraction d information temporelle Thèse Défense publique
Plus en détailClub langue française Quiz. Par Julien COUDERC et Maxence CORDIEZ
Club langue française Quiz Par Julien COUDERC et Maxence CORDIEZ Question 1 Quelle est l'orthographe correcte? 1. J'ai vécu des amours passionnés. 2. J'ai vécu des amoures passionés. 3. J'ai vécu des amours
Plus en détailNicolas Turenne. Université Paris-Est & INRA. UMR LISIS (Joint Research Unit Interdisciplinary Laboratory Sciences Innovations Societies)
Plateforme VESPA Miningpour accéder aux archives de l épidémiosurveillance végétale. Nicolas Turenne Université Paris-Est & INRA UMR LISIS (Joint Research Unit Interdisciplinary Laboratory Sciences Innovations
Plus en détailFormats d images. 1 Introduction
Formats d images 1 Introduction Lorsque nous utilisons un ordinateur ou un smartphone l écran constitue un élément principal de l interaction avec la machine. Les images sont donc au cœur de l utilisation
Plus en détailCâblage des réseaux WAN. www.ofppt.info
Office de la Formation Professionnelle et de la Promotion du Travail Câblage des réseaux WAN C-D-002.doc Mars 1-7 Sommaire 1. Couche physique WAN... 3 1.1. Connexions série WAN... 4 1.2. Routeurs et connexions
Plus en détailCette Leçon va remplir ces attentes spécifiques du curriculum :
Dev4Plan1 Le Plan De Leçon 1. Information : Course : Français Cadre Niveau : Septième Année Unité : Mes Relations Interpersonnelles Thème du Leçon : Les Adjectifs Descriptifs Date : Temps : 55 minutes
Plus en détailNOTICE SUR LES MEMOIRES DE MASTER 2
Masters 2 LTMT et anglais LCE (linguistique) NOTICE SUR LES MEMOIRES DE MASTER 2 Le Master 2 est en partie une formation à la recherche par la recherche, et celle-ci exige une grande méticulosité. La présentation
Plus en détailPrototype de canal caché dans le DNS
Manuscrit auteur, publié dans "Colloque Francophone sur l Ingénierie des Protocoles (CFIP), Les Arcs : France (2008)" Prototype de canal caché dans le DNS Lucas Nussbaum et Olivier Richard Laboratoire
Plus en détailDiapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)
COMMENTAIRE Séminaire national Réforme de la série Gestion-administration Lyon 10 et 11 mai 2012 Vendredi matin Martine DECONINCK (IEN EG), Michèle SENDRE (IEN L), Isabelle VALLOT (IEN EG) Diapo 1. Objet
Plus en détailDescription de Produit Logiciel. AMI News Monitor v2.0. SPD-AMINM-10 v1.0
Description de Produit Logiciel AMI News Monitor v2.0 SPD-AMINM-10 v1.0 Octobre 2010 Sommaire 1 Préambule... 3 2 Approbations... 3 3 Fonctionnalités... 4 3.1 Principes... 4 3.2 Sources d information...
Plus en détailCarrotAge, un logiciel pour la fouille de données agricoles
CarrotAge, un logiciel pour la fouille de données agricoles F. Le Ber (engees & loria) J.-F. Mari (loria) M. Benoît, C. Mignolet et C. Schott (inra sad) Conférence STIC et Environnement, Rouen, 19-20 juin
Plus en détailDOCADOCT 2014/2015 MOTEURS DE RECHERCHE SPECIALISES
DOCADOCT 2014/2015 MOTEURS DE RECHERCHE SPECIALISES Lundi 20 avril 2015 de 10h à 12h : ST - Belfort Mardi 21 avril 2015 de 10h à 12h : ST Besançon Jeudi 23 avril 2015 de 10h à 12h : SLHS Besançon Véronique
Plus en détailLe menu du jour, un outil au service de la mise en mémoire
Le menu du jour, un outil au service de la mise en mémoire Type d outil : Outil pour favoriser la mise en mémoire et développer des démarches propres à la gestion mentale. Auteur(s) : Sarah Vercruysse,
Plus en détailE-Gen : traitement automatique des offres d emploi
591 E-Gen : traitement automatique des offres d emploi Rémy Kessler 1, 2, Marc El-Bèze 1 1 Laboratoire Informatique d Avignon, BP 1228 F-84911 Avignon Cedex 9 FRANCE 2 AKTOR Interactive Parc Technologique
Plus en détailVoici Léa : elle est blonde et elle a les yeux bleus. Elle a douze ans. Elle porte un t-shirt blanc. a. b. c.
et MODULE CONTRAT D APPRENTISSAGE Dans ce module, tu vas apprendre à demander et dire ton âge décrire des personnes décrire des vêtements parler des ressemblances et des différences Pour écrire une annonce
Plus en détailFiche pédagogique : ma famille et moi
Fiche pédagogique : ma famille et moi Tâche finale de l activité : Jouer au «Cluedo» Niveau(x) Cycle 3 Contenu culturel : - jeux de sociétés Connaissances : Connaissances requises : - cf séquences primlangue
Plus en détailMaster IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008
Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance
Plus en détailI. Le déterminant Il détermine le nom. Le déterminant indique le genre, le
I. Le déterminant Il détermine le nom. Le déterminant indique le genre, le nombre et le degré de détermination du nom. 1. L article le, la, les, l, d, au, aux, du, des, un, une, des, du, de l, de la, des.
Plus en détailACTIVITÉ 1 : LES ADJECTIFS POSSESSIFS
ACTIVITÉ 1 : LES ADJECTIFS POSSESSIFS 1. Choisis et entoure l adjectif possessif qui convient. a Je ne trouve pas mon / ma / mes lunettes. b Tu veux venir à son / sa / ses fête d anniversaire? c Nous n
Plus en détailAide du Grand dictionnaire terminologique
Aide du Grand dictionnaire terminologique Office québécois de la langue française Mars 2015 Table des matières Introduction... 1 Comment interroger la banque?... 1 Saisie semi-automatique... 1 Comment
Plus en détailStructuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,
Plus en détailGuide de la solution SYSTIMAX GigaSPEED X10D FTP
Guide de la solution SYSTIMAX GigaSPEED X10D FTP La solution SYSTIMAX GigaSPEED X10D FTP www.systimax.com Table des matières Introduction 1 Performances du canal SYSTIMAX GigaSPEED X10D FTP 2 Câble SYSTIMAX
Plus en détailDifferential Synchronization
Differential Synchronization Neil Fraser Google 2009 BENA Pierrick CLEMENT Lucien DIARRA Thiemoko 2 Plan Introduction Stratégies de synchronisation Synchronisation différentielle Vue d ensemble Dual Shadow
Plus en détailInterférences lexicales entre deux langues étrangères: anglais et français
Interférences lexicales entre deux langues étrangères: anglais et français Université de Marmara Résumé: Dans cet article, nous nous interrogerons sur les transferts lexicaux qui se réalisent entre l anglais
Plus en détailUML (Paquetage) Unified Modeling Language
UML (Paquetage) Unified Modeling Language Sommaire Introduction Objectifs Paquetage Espace de nommage d un paquetage Dépendances entre paquetages 2 Notion introduite véritablement par UML car superficiellement
Plus en détailRecherche bibliographique
Séminaire «Maîtrise de l information scientifique» Recherche bibliographique Dernière mise à jour : 07/01/2015 - Auteur : Frédérique Flamerie Recherche bibliographique : méthode & outils La recherche bibliographique
Plus en détailDire à quelqu un de faire quelque chose
PARCOURS 1 Vous avez un problème? Dire à quelqu un de faire quelque chose SÉQUENCE 2 : PAS DE PROBLÈME SANS SOLUTION p. 15 Peut généralement identifier le sujet d une discussion se déroulant en sa présence
Plus en détailLa traduction automatique des articles de l anglais au français
Université de Gand Faculté de Philosophie et Lettres Année universitaire 2012-2013 La traduction automatique des articles de l anglais au français Lissa Catthoor Mémoire de master présenté en vue de l
Plus en détailExpériences de formalisation d un guide d annotation : vers l annotation agile assistée
Expériences de formalisation d un guide d annotation : vers l annotation agile assistée Bruno Guillaume 1,2 Karën Fort 1,3 (1) LORIA 54500 Vandœuvre-lès-Nancy (2) Inria Nancy Grand-Est (3) Université de
Plus en détailUNITÉ 5 VOILÀ VOTRE CLÉ!
UNITÉ 5 VOILÀ VOTRE CLÉ! Vous allez apprendre à : décrire un hôtel questionner à propos d une réservation comprendre des annonces immobilières décrire un appartement compter jusqu à 1000 donner une opinion
Plus en détailPrésentation du sujet de thèse Schémas temporels hybrides fondés sur les SVMs pour l analyse du comportement du conducteur
Présentation du sujet de thèse Schémas temporels hybrides fondés sur les SVMs pour l analyse du comportement du conducteur Réalisé par : Bassem Besbes Laboratoire d Informatique, Traitement de l Information
Plus en détail6 ème. Rallye mathématique de la Sarthe 2013/2014. 1 ère épreuve de qualification : Problèmes Jeudi 21 novembre 2013
Retrouver tous les sujets, les corrigés, les annales, les finales sur le site du rallye : http://sarthe.cijm.org I Stéphane, Eric et Christophe sont 3 garçons avec des chevelures différentes. Stéphane
Plus en détailEvaluation diagnostique de CM1 Circonscription de Saint Just en Chaussée Livret du maître partie Français
Evaluation diagnostique de CM1 Circonscription de Saint Just en Chaussée Livret du maître partie Français Avant de débuter, demander aux élèves de préparer le matériel suivant : crayon à papier, gomme,
Plus en détailCalc 2 Avancé. OpenOffice.org. Guide de formation avec exercices et cas pratiques. Philippe Moreau
OpenOffice.org Calc 2 Avancé Guide de formation avec exercices et cas pratiques Philippe Moreau Tsoft et Groupe Eyrolles, 2007, ISBN : 2-212-12036-2, ISBN 13 : 978-2-212-12036-3 4 - Plages de données 4
Plus en détailAide : publication de décisions VS
Aide : publication de décisions VS Table des Matières Introduction... 2 Recherche (Recherche dans le texte intégral)... 2 Filtres... 3 Collection d arrêts... 4 Date de la décision et date de publication...
Plus en détailLIVRE BLANC Décembre 2014
PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis
Plus en détail2. Garantie En cas de problème ou de question technique, vous pouvez contacter notre hotline au numéro indigo ci-contre :
1. Important Prenez le temps de lire ce manuel utilisateur avant d utiliser votre antenne terrestre d intérieur. Ce manuel contient des informations importantes concernant le fonctionnement de votre antenne.
Plus en détailVers une approche Adaptative pour la Découverte et la Composition Dynamique des Services
69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard
Plus en détail