Présentation à Melodi (IRIT)



Documents pareils
Atelier rédactionnel

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

Expériences de formalisation d un guide d annotation : vers l annotation agile assistée

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

Grammaires d unification

Cours No 3 : Identificateurs, Fonctions, Premières Structures de contrôle.

1 On peut consulter et interroger ce corpus sur le site de l équipe DELIC :

PROJET DE FIN D ETUDES

ACTIVITÉS DE COMMUNICATION LANGAGIÈRE ET STRATÉGIES

Expression des contraintes. OCL : Object C o n t r a i n t L a n g u a g e

PRÉPONDÉRANCE DU CONTEXTE EXTRALINGUISTIQUE DANS LA CONSTRUCTION DU SENS : L EXEMPLE DES COMMUNICATIONS DE TRAVAIL DANS LA NAVIGATION AÉRIENNE

Entre Relations Temporelles et Relations de Discours

TD 1 - Structures de Traits et Unification

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES

Vérification formelle de la plate-forme Java Card

Le Cadre Européen Commun de Références pour les Langues

Votre quotidien à Blanche

CUNY Language Immersion Program

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

Portail Vocal d Entreprise

L auto-archivage en maths, quoi de neuf?

Pour un dialogue entre jeux et rhétorique

PRÉSENTATION Stanley Security France

SÉJOURS LINGUISTIQUES

LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION

Prise en compte de la population sourde dans le système de soins

I. Le déterminant Il détermine le nom. Le déterminant indique le genre, le

Programme de la 1ère année

Groupes de compétences. C est possible! Même en solo!

Petit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Semestre HPC. Violaine Louvet. Institut Camille Jordan - CNRS louvet@math.univ-lyon1.fr. Labex MILyon, Printemps 2016

Ecole Technique «Transformation de données documentaires» Poitiers, mars Atelier 1: Sphinx. import, conversion, export de données

DESCRIPTEURS NIVEAU A2 du Cadre européen commun de référence pour les langues

Modélisation des données

ENTRE LES MURS : L entrée en classe

Parcours DIWEB : (Données, Interaction et Web)

Mots interrogatifs. Quand,comment,pourquoi,qui... sont des mots interrogatifs qui servent à introduire une phrase interrogative.

CAP C.R.M. Conducteur Routier Marchandises

Tout au long de votre cursus Quel métier futur? Dans quel secteur d activité? En fonction de vos goûts et aptitudes et du «niveau d emploi» dans ce

Le jour de la formation, deux possibilités s offriront à vous afin de suivre les conférences en direct, à distance, et en ligne :

RECONNAÎTRE UN NOM. Tu vas apprendre à reconnaître un nom!!!!!!

Bilan des formations présentées lors de la semaine étudiant SEGEUN 2013

Procédure d installation de mexi backup

Pour chaque projet est indiqué son titre, le ou les laboratoires participants ainsi que le coordinateur

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches

LES INTERFACES HOMME-MACHINE

Les marchés de l immobilier à l international. Évolutions, structures et performances

Servir ses utilisateurs sans bureau d accueil physique

Thèmes et situations : Renseignements et orientation. Fiche pédagogique

Plan de formation 2nd degré CREER, INNOVER

Une école au Togo, épisode 1/4

Chapitre 1 Qu est-ce qu une expression régulière?

metal USB PEOPLE tel USB people Electronique 03 Objets et Cadeaux Publicitaires

BILAN D ACTIVITE DU PÔLE DE SOUTIEN PSYCHOLOGIQUE Année 2010

MABioVis. Bio-informatique et la

Conception des bases de données : Modèle Entité-Association

Le Collège de France crée une chaire pérenne d Informatique, Algorithmes, machines et langages, et nomme le Pr Gérard BERRY titulaire

MODERN LANGUAGES DEPARTMENT

Bibliothèque des Compétences clés

À propos d exercice. fiche pédagogique 1/5. Le français dans le monde n 395. FDLM N 395 Fiche d autoformation FdlM

Création de jeu vidéo

Protection et amélioration de la sécurité des systèmes d'exploitation

Les Cahiers de l Actif

22 janvier 2010 «Journée franco-allemande» «Points Info OFAJ» et «DFJW-Infotreffs»

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Commerce International. à référentiel commun européen

Suivi de cohortes

Programmation Web. Madalina Croitoru IUT Montpellier

N SIMON Anne-Catherine

Fiche de synthèse sur la PNL (Programmation Neurolinguistique)

CATALOGUE DE FORMATION POLE RESSOURCES NUMERIQUES

Ordre du jour provisoire pour la COP12

1 Description générale. Résumé

Des conditions d accueil privilégiées au lycée Couperin

Les transports en commun Vocabulaire Mots 1

I. Présentation générale des épreuves écrites

Catalogue DIF. Formations linguistiques

Notre. GÉNIE Location de personnel

Apprentissage Automatique

Master 2 Juriste d'affaires. Master 2 Juriste d'affaires Internationales Master 2 Droit de l'entreprise spécialité Droit des Affaires et Fiscalité

Passerelle : 13 Ecoles pour le Concours 2013

Thomas Dutronc : Demain

Groupement d'achat UNI-HA SSI: sécurisation pragmatique, efficiente et homogène des SI de Sante en partenariat avec l'asip Sante et les FSSI

Ci-après, la liste des masters proposés par les universités françaises pour se former, en 2 ans après la licence, à l un des métiers de la culture.

Bienvenue au lycée Hoche! Journée Portes Ouvertes CPGE Samedi 25 janvier 2014

DON D ORGANES Donneur ou pas

Machines virtuelles Cours 1 : Introduction

CONSEIL AUX PERSONNES CONSEIL AUX ORGANISATIONS

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

OCTOBRE L M M J V S D CALENDRIER SCOLAIRE

Document d aide au suivi scolaire

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

vos contacts CREDIT FONCIER IMMOBILIER

Transcription:

Présentation à Melodi (IRIT) Christian Retoré prof. d info université de Bordeaux en délégation C.N.R.S. à l IRIT en 2012 2013 mardi 18 septembre 2012

1. Quand j étais jeune : logique (preuves) Thèse de maths (Paris 7, 1993) en logique, théorie de la démonstration. logique linéaire en particulier non commutative Techniquement : syntaxe logique, structure des preuves, graphes de preuves sémantique catégorique (dénotationnelle) logique intuitionniste, proofs-as-programs Applications en vue : programmation fonctionnelle, partage de calculs, calcul de processus 16 mois à Imperial College, Londres (service national ;-)

2. INRIA (PostDoc, CR) Sophia, Nancy, Rennes : grammaires catégorielles Révélation en 1994 (merci à Alain Lecomte, Grenoble), logique linéaire intuitionniste non commutative = calcul de Lambek, "moteur" des grammaires catégorielles analyser une preuve c est construire une preuve dans cette logique de t 1,..., t n S où t i est une formule logique associée au i-ième mot par le lexique parsing-as-deduction Lexicalisées (règles universelles, seul le lexique varie) Apprenables à la limite (Gold) Interface syntaxe sémantique Nancy (94-97) : Equipe Projet INRIA Calligramme (co-fondateur) Rennes (1998-2002) : Equipe Projet INRIA Aïda & Paragraphe acquisition de grammaires catégorielles

3. Prof. Bordeaux (2002 ) : syntaxe et sémantique Principalement dans le cadre des grammaires catégorielles mais pas seulement (grammaires minimalistes) sémantique de Montague mais aussi Lambda DRT développement de la linguistique informatique à Bordeaux montage de l équipe projet INRIA Signes (2002 2011) (analyse syntaxique et sémantique, Néerlandais, Français, Langues des Signes avec des gens de l ERSS) rédacteur en chef de TAL (2004 2009) fort investissement dans le GDR sémantique et modélisation (2006 Bordeaux, 2008 Toulouse) organisation d ESSLLI 2009 à Bordeaux (des volontaires pour ESSLLI Toulouse 2014?)

4. Situation à Bordeaux Beaucoup moins de soutien de la direction depuis 2007 par exemple plus de recrutement depuis 2006, équipe INRIA arrêtée fin 2011. Quelques départs (mutations, promotions). Qui reste-t-il? Lionel Clément (syntaxe des verbes en LFG) Sylvain Salvati (grammaire d arbres, lambda calcul) Richard Moot (logique, grammaires catégorielles, syntaxe et sémantique) soit 1 interlocuteur... Deux thèses en 3e et 4e année : acquisition statistique et symbolique de grammaires catégorielles (Noémie-Fleur Sandillon-Rezer), modélisation du temps dans les récits de voyage (Anaïs Lefeuvre, à Blois en 2012-2013), Pas fâché de venir un an dans Melodi!

5. Liens officiels avec Toulouse ITIPY (région & INRIA) Bordeaux Pau Toulouse (2009 2012) Reconstruction d itinéraires à partir de récits de voyage du XIXe dans les Pyrénées Une thèse en cours, Anaïs Lefeuvre POLYMNIE ANR CONTINT Nancy Paris 7 Bordeaux Toulouse (2012 2015) discours dans les grammaires catégorielles abstraites PRELUDE/LOCI ANR Blanc (parfois avec Nicholas) (2008 2014) Bordeaux Nancy Paris 8 Utilisation de la théorie de la démonstration et de jeux ("ludique") pour modéliser discours et dialogue.

6. Thématique : logique et linguistique Thèmes linguistiques Syntaxe et sémantique Syntaxe, convergence entre : grammaires de Lambek, grammaires minimalistes Sémantique compositionnelle Interface syntaxe sémantique Interface sémantique discours Pragmatique lexicale Méthodes Logique, preuves formelles, théorie des types, catégories Arbres et graphes de preuves = analyses syntaxiques Syntaxe sémantique (transformations logiques) Logique d ordre supérieur en théorie des types Données, expériences (à développer!) Initialement : exemples livresques Corpus Itipy (Pau Bordeaux Toulouse) récits de voyage Corpus CID dialogues (Aix) discussion sur "insolite" Futur : expériences (phénomènes rares, énoncés incorrects)

7. Syntaxe et logique non commutative : une page est tournée R. Moot & Ch. Retoré, The logic of categorial grammars, Springer, Juillet 2012. Même si nous continuons à étudier quelques points de syntaxe catégorielle, nous sommes moins actifs sur ces questions et davantage tournés vers la sémantique.

8. Syntaxe sémantique Analyse catégorielle (= preuve = λ-terme) + λ-termes lexicaux formule logique exprimant «qui fait quoi» word type sémantique u semantics : λ-terme de type u x v la variable ou constante x est de type v certains (e t) ((e t) t) énoncés λp e t λq e t ( (e t) t (λx e ( t (t t) (P x)(q x)))) e t λx e (statement e t x) parlent_de e (e t) λy e λx e ((speak_about e (e t) x)y) eux-mêmes (e (e t)) (e t) λp e (e t) λx e ((P x)x)

Pour la phrase : Some statements speak about themselves. La syntaxe fournit un λ-terme de ce genre : de type S = t ((some statements) (themselves speak_about)) On remplace les mots par les lambda termes correspondant, et on réduit...

( (λp e t λq e t ( (e t) t (λx e ((P x)(q x))))) ) (λx e (statement e t x)) ( (λp e (e t) λx e ((P x)x)) ) (λy e λx e ((speak_about e (e t) x)y)) β (λq e t ( (e t) t (λx e ( t (t t) (statement e t x)(q x))))) (λx e ((speak_about e (e t) x)x)) β ( (e t) t (λx e ((statement e t x)((speak_about e (e t) x)x)))) le résultat est y plus lisible ainsi : x : e (statement(x) speak_about(x, x))

9. Programme à l IRIT : sémantique en théorie des types Dans le cadre compositionnel ci-dessus comment rendre compte : de la sémantique lexicale : filtrer les compositions impossibles * la chaise crie mais ajouter de la flexibilité quand nécessaire Liverpool a battu Milan de certaines questions classiques de sémantique quantification généralisée un tiers, la plupart, pluriels Les étudiants ont moins de 30 ans. Ils se sont rencontrés. Implémentation dans la plateforme d analyse syntaxique et sémantique Grail de Richard Moot (grammaires catégorielles, lambda-drt).

10. Sémantique et pragmatique lexicale avec Bruno Mery et Christian Bassac Modélisation dans le lexique (λ-calcul polymorphe du 2nd ordre, avec quantification sur les types Λ) : Structure argumentale : λ-terme usuel à utiliser Glissement de sens : λ-termes optionnels, transformations. Langue monde : Ma voiture est crevée/*bouchée.

11. Sémantique et pragmatique lexicale suite Contraintes Rigide : la même transformation pour chaque occurrence. Flexible : des transformations différentes pour chaque occurrence. Flexible : Rigide : Paris est une capitale cosmopolite. (gens, administration) Ce livre est intéressant mais encombrant. Montpellier est mal classé mais doit pourtant affronter Arsenal. (équipe) * Washington est au bord du Potomak et a attaqué l Iraq par deux fois.

12. Sémantique et pragmatique lexicale fin Dans la version implémentée (en λ-drt), les contraintes sont spéficiées dans le lexique mais gérées par un mécanisme externe au λ-calcul. Une amélioration récente : en utilisant un λ-calcul linéairement typé, on peut exprimer les contraintes seulement avec les types, sans mécanisme externe.

13. Phénomènes traités Le cas classique : une petite pierre (pierre : phys) *la chaise crie (chaise : phys crie : animal t) Les facettes : Barcelone a battu Séville. Barcelone refuse un statut transfrontalier à la Cerdagne. * Barcelone a battu Séville et refuse un statut transfrontalier à la Cerdagne.

14. À quoi sert le second ordre? Il y a beaucoup de types avec beaucoup de liens entre eux (une ontologie langagière?). Le second ordre permet de définir des opérations uniformes sur des familles de types : Étant donnés deux prédicats P α t (par ex. lourd) et Q β t (par. intéressant) sur des sortes respectives α (par ex. objets) et β (par ex. info) deux transformations de ξ (livre) vers α et vers β on peut coordonner des objets de type ξ : Λξλx ξ λf ξ α λg ξ β.(and (P (f x))(q (g x))) pour analyser ce genre de phrase : Ce livre est lourd mais intéressant.

15. Extension au voyageur fictif avec Richard Moot et Laurent Prévot Corpus Itipy : (1) (...) cette route monte jusqu à Lux où l on arrive par une jolie avenue de peupliers. (2) (...) cette route qui monte sans cesse pendant deux heures le complément de temps nécessite un voyageur fictif empruntant la route. Montée de type λ-terme optionnel transformation sur le type élevé. Cas particulier du précédent : conflit de type entre animé et route, et route possède un λ-terme optionnel qui introduit le voyageur et l événement ce qui permet aussi de traiter aussi la route agréable.

16. Lien avec Itipy L extension précédente à été conçue pour le projet Itipy (récits du 19 e de voyages dans les Pyrénées), reconstruction d itinéraire : 1. (autres outils) Sélection des passages concernés. 2. Analyse syntaxique (grammaire catégorielle acquise), sémantique en lambda-drt 3. Sémantique / pragmatique lexicale. 4. (à faire) S-DRT pour exprimer les relations discursives entre DRS

17. Quantification - projet Loci, avec Abrusci Chacun / tous les : collection, ensemble Tout, un (générique) : preuves } Th. de complétude : les 2 coïncident... La langue Quantifie sur des ordres supérieurs : (3) Tout le monde ment, mais lui croit tout. Regorge de quantifications généralisées (souvent implicites) (4) Les français grelottent pour faire des économies Plus de théorème de complétude! Modèles (mesures et non cardinaux) : (5) La plupart des nombres sont premiers. Non. (6) La plupart des nombres ne sont pas premiers. Oui. Les modèles requièrent de considérer tous les mondes possibles, et sont donc peu réalistes.

18. Quantification Qu est-ce qu un quantificateur? Modèles et RÈGLES. Règles? Réfutations? Jeux entre modèles (ensembles) et preuves (générique) : Générique : Un chien, ça peut toujours mordre. (élément du modèle) Mais non, pas Rex. (autre générique) Mais non, pas un basset. Mais quelles données pour valider notre modélisation? dialogue pour observer l incompréhension, mais données maigres et la quantification est rare dialogues ciblés mais expériences spécifiques (EEG, temps de réaction).

19. Les pluriels avec Richard Moot Introduire des opérateurs permettant de constituer des ensembles, de forcer la lecture collective ou distributive. Les deux déménageurs ont porté le piano. Les deux déménageurs avaient une quarantaine d années.

20. Quelques références Structure du lexique pour la sémantique compositionnelle et la pragmatique lexicale : article dans Journal of Logic, Language and Information, 2010 Un article plus récent est en préparation pour : Language and linguistic compass (un peu de pub pour cette nouvelle revue) Voyageur virtuel : en français à la Montague (TALN 2011) ou en anglais avec la λ-drt (CID 2011) Quantification : "most" dans ce cadre (article dans RLV) ou bien notre communication sur les interprétations en termes de preuves au 14th CLMPS (article à venir) Pluriels : notre communication Coconat workshop

21. Quelques questions que j aimerais aborder avec MELODI (discussions avec R. Moot, N. Asher, Z. Luo, L. Prévot, S. Soloviev) Quels sont les types de base? les noms communs? les sortes d une ontologie? toute propriété? Peut-on les acquérir? Quel est le lien entre la formulation logique livre(x) (qui peut être nié) et le typage x : livre (qui ne peut pas être nié, comme une présupposition). Quel est la bonne notion de sous-typage qui fonctionne avec le typage polymorphe? Une question toute récente : les modèles dénotationnels de la théorie des types (domaine de Scott, espace cohérent) peuvent-ils être utilisés comme structure pour rendre compte d une ontologie? quelques travaux en ce sens (article récent de Abrusci, Fouqueré, Romano). Tests en corpus, expériences pour valider notre modélisation. Implantation dans Grail des avancées.

22. En pratique Exposé plus détaillé le vendredi 5 octobre à 14h à l IRIT. Workshop sémantique lexicale dans le cadre de l ANR blanc Loci (invités : Robin Cooper, Zhaohui Luo) octobre ou novembre 2012 Mise en place de l ANR ContInt Polymnie réunion d ouverture à Nancy en octobre 2012 réunion à Toulouse au printemps 2012? Sémagramme, Nancy ; IRIT, Toulouse ; Labri, Bordeaux ; Alpage, Paris