La linguistique au service d'une recherche appliquée à l'informatique: Un exemple de thèse en Traitement Automatique des Langues (TAL)

Documents pareils
MASTER LPL : LANGUE ET INFORMATIQUE (P)

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Les poursuites d études en lettres modernes? I Que faire après une L2?

Numilog - Téléchargement des ebooks Mode d emploi

Master Information et communication spécialité Produits et services multimédia

Quel que soit L élève - Il est valorisé par l utilisation d un outil technologique haut de gamme - Il peut travailler seul et à son rythme.

MASTER PROFESSIONNEL STAPS MANAGEMENT ET INGENIERIE DU SPORT OPTION GESTION DU SPORT ET DEVELOPPEMENT TERRITORIAL

UNIVERSITÉ 66,8 C.P.G.E. 74,8 % D.U.T. B.T.S. 13,4 % 2,3 11,1 Autres formations 9,7. Total : 97,5 % 7,8 0,2. Lettres Economiques

Observatoire Régional R Enseignements Supérieurs en Bretagne (ORESB) Quelques chiffres clefs sur l insertion professionnelle

Depuis votre ordinateur de bureau

Apprenez gratuitement 4 langues. wallangues. Formations en langues sur internet néerlandais, allemand, anglais, français. Contient la clé pour

Le DUT est un diplôme professionnel qui permet une entrée directe sur le marché du travail ou une poursuite d études.

Office Pro Plus. Procédures d installation. Direction des Systèmes d Information Grenoble Ecole de Management. Date de publication Juin 2014

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES

DONNER DE L ÉLAN DROIT. Sciences sociales UNIVERSITÉ DE POITIERS. >> Faites confiance à l Université pour la formation des talents de demain.

Vous pourrez ainsi : Accéder rapidement à la boutique Kindle d'amazon pour ajouter des livres (gratuits ou payants).

Demande d inscription ANNEE UNIVERSITAIRE

LA REFORME LMD EN COTE D IVOIRE :

Master Energie spécialité Energie électrique

DOSSIER DE CANDIDATURE MASTER Master 1 avec Option :

INVESTISSEMENTS D AVENIR

DUT Informatique, orientation Imagerie Numérique

OUVERTURE DE VACANCE

Le master en administration publique (MPA) à l IDHEAP : Une formation multidisciplinaire pour les directeurs d établissements scolaires

Apprentissage Automatique

Aller plus loin avec la CRM?

En tant que producteur de technologies applicatives, nous vous proposons un large panel de solutions vocales :

Master Informatique Aix-Marseille Université

I. PRESENTATION DE LA CHAIRE

ANNEXE DESCRIPTIVE (déclinaison française du «Supplément au Diplôme»)

Christelle MAZIERE (30 ans)

Comment utiliser la plate-forme de dictées Philips speechexec

Description du programme du Master M2 MIAGE SIIN (1)

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

Programme scientifique Majeure INTELLIGENCE NUMERIQUE. Mentions Image et Réalité Virtuelle Intelligence Artificielle et Robotique

Rapport d évaluation du master

Les technologies d aide

Rapport d évaluation du master

Master Génie des Systèmes Industriels

Licence Professionnelle Gestion de l'économie sociale et solidaire et Entrepreneuriat

MATHEMATIQUES ET SCIENCES POUR L INGENIEUR

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)

MASTER RECHERCHE CINEMA : APPROCHES INTERCULTURELLES

CANUDC - REGLES DU JEU DE LA PARTICIPATION AU CANUDC 1

MASTER MARKETING VENTE, SPÉCIALITÉ MARKETING STRATÉGIQUE DES PRODUITS ET DES MARQUES

GUIDE D UTILISATION DU LOGICIEL DE TELE-MAINTENANCE. TEAM VIEWER Version 7.

Portail Vocal d Entreprise

PHILA-Collector-USB-16Go Pour Windows & Android

MASTER (LMD) MODELISATION, OPTIMISATION, COMBINATOIRE ET ALGORITHME

LICENCE PROFESSIONNELLE

EXPATRIATION EN UNIVERSITE PARTENAIRE inclusif CAMPUS IPAB BS RIVERSIDE

MASTER MANAGEMENT STRATEGIE, SPECIALITE CONSULTANT EN MANAGEMENT, ORGANISATION, STRATÉGIE

ACCROÎTRE SON AUTONOMIE AVEC UNE TABLETTE. Regards croisés d'usagers et de professionnels en surdité

Document d aide au suivi scolaire

Service d information pour remise de paiement de factures Scotia

Les appareils mobiles vous en mettent plein la vue! Colloque réadaptation aides techniques 2014

S LICENCE INFORMATIQUE Non Alt Alt SS1 S2 S3 S4 S5 S6 Parcours : IL (Ingénierie Logicielle) SRI (Systèmes et Réseaux Informatiques)

Fiche de synthèse sur la PNL (Programmation Neurolinguistique)

MASTER. Sciences du Management. Site d études : ESCE - Paris-La Défense. Formation continue et à distance (semi-présentiel)

sommaire L organisation et la gestion des archives d entreprise...7

MASTER EN COMMUNICATION DIGITALE

Partenaire de votre entreprise

DROIT, ÉCONOMIE & GESTION MASTER DROIT DES COLLECTIVITÉS TERRITORIALES. Collectivités littorales.

SUPPLEMENT AU DIPLOME

Les métiers de la recherche

Méthode du commentaire de document en Histoire

Spécialité IAD. Master de Sciences et technologie de l UPMC. Mention informatique. Partenaires : ENST, ENSTA. Responsables : T. Artières, C.

Applications pour le travail

UE11 Phonétique appliquée

Bienvenue à l UCL, dans une

Qu est-ce qu un résumé?

Compte-rendu du Conseil de l'ufr Sciences du Langage 16 décembre 2011, 15h-17h30 Université Paris 8 salle A 2261

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

L Institut National des Sciences Mathématique et de leurs. Premiers éléments d un bilan à deux ans.

LIVRET DE SUIVI DE SCOLARITE EN SEGPA RELEVE DE COMPETENCES

Etudier à l'etranger. Informations. Enseignement ETATS UNIS

PROGRAMME BRAFITEC BRAsil France Ingénieurs TEChnologie

Master 1 Spécialité Professionnelle Image & Son. DOSSIER de CANDIDATURE Etat civil

*Ce Master peut donner accès au Doctorat en Études Internationales pour la Paix, les Confits, et le Développement. Il a été honoré de la mention de

L histoire économique, sociale et des techniques

Etudier l informatique

Rencontres Cap Digital/ Master MTI

Projet de Portail des thèses. SYNTHESE DE L ENQUETE DESTINEE AUX DOCTORANTS août 2010

BES WEBDEVELOPER ACTIVITÉ RÔLE

MASTER LANGUES, LITTÉRATURES ET CIVILISATIONS ETRANGÈRES ET RÉGIONALES. Parcours Langues et Technologies (LT)

Notice CUBE TALK 9x U65GT

UNIVERSITE HASSAN II DE CASABLANCA. FACULTE DES SCIENCES & TECHNIQUES MOHAMMEDIA Département Génie Electrique

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant

Partir aux Etats-Unis

Inventaire des ressources mises en œuvre dans les présentations de l'école communicante, 2010

Licence Professionnelle Génie logiciel, développement d'applications pour plateformes mobiles

Section des Formations et des diplômes

Partenaire de votre entreprise

inviu routes Installation et création d'un ENAiKOON ID

DOSSIER DE 2014/2015

Communication. Les différentes sous-familles et leurs missions. Communication interne, externe, relations publiques (13A)

Étudier en Belgique. Un programme d échanges en Belgique vous intéresse? INFORMATION UNIVERSITAIRE

RÉSUMÉ DESCRIPTIF DE LA CERTIFICATION (FICHE RÉPERTOIRE)

Transcription:

Les linguistes dans le monde professionnel La linguistique au service d'une recherche appliquée à l'informatique: Un exemple de thèse en Traitement Automatique des Langues (TAL) Marine Damiani marinedamiani@gmail.com Doctorante en 4ème année UMR 7114 MoDyCo/CNRS 18 février 2015

Traitement Automatique des Langues, TAL, Ingénierie Linguistique Qu est-ce que c est? Le Traitement Automatique des Langues (abr. TAL), appelé parfois Traitement Automatique du langage naturel (abr. TALN) ou encore Ingénierie Linguistique est une discipline à la frontière de la linguistique, de l informatique et de l intelligence artificielle, qui concerne l'application de programmes et techniques informatiques à tous les aspects du langage humain. Les professionnels du TAL doivent donc posséder une double compétence en linguistique et en informatique.

Plan de la présentation 1. Dans quel type de projets a-t-on besoin de linguistes spécialisés en ingénierie linguistique (ou TAL)? 2. Parcours universitaire 3. S inscrire en thèse? 4. Exemple d un projet de TAL: annotation de dépêches de presse pour une utilisation dans un système de Recherche d Information (RI)

1. Dans quels types de projets a-t-on besoin de linguistes spécialisés en TAL? 1. Les projets en relation avec la production où la modification de texte: La correction orthographique automatique La traduction automatique 2. Les projets en relation avec le traitement du signal: La synthèse de la parole (ex: Microsoft Reader, GPS) La reconnaissance vocale (ex: SVOICE, SIRI) 3. Les projets en relation avec l'extraction d'information: La recherche d information L analyse d opinion La veille technologique

La correction orthographique automatique Les étudiants résidant à Évry en veulent, et se mobilise massivement pour faire évoluer le logement social étudiant de la ville d Évry qui sont le moins équipés de toute l académie de Versaille. C est dans cet élan, que les réisdences du CROUS d Évry obtiennent pour la seconde année consécutive, le taux de participation le plus élevé de toute la France pour reconduire leur élut FEEEVE avec 82% des voix, lors des élections du 17 novembre.

La correction orthographique automatique http://www.cordial-enligne.fr/

La correction orthographique automatique http://www.scribens.fr/

1. Dans quels types de projets a-t-on besoin de linguistes spécialisés en TAL? 1. Les projets en relation avec la production où la modification de texte: La correction orthographique automatique La traduction automatique 2. Les projets en relation avec le traitement du signal: La synthèse de la parole (ex: Microsoft Reader, GPS) La reconnaissance vocale (ex: SVOICE, SIRI) 3. Les projets en relation avec l'extraction d'information: La recherche d information L analyse d opinion La veille technologique

La traduction automatique

La traduction automatique http://www.linguee.fr/

La traduction automatique

La traduction automatique

1. Dans quels types de projets a-t-on besoin de linguistes spécialisés en TAL? 1. Les projets en relation avec la production où la modification de texte: La correction orthographique automatique La traduction automatique 2. Les projets en relation avec le traitement du signal: La synthèse de la parole (ex: Microsoft Reader, GPS) La reconnaissance vocale (ex: SVOICE, SIRI) 3. Les projets en relation avec l'extraction d'information: La recherche d information L analyse d opinion La veille technologique

La synthèse de la parole http://voxygen.fr/fr

La synthèse de la parole Application smartphone et tablette: https://play.google.com/store/apps/details?id=com.google.andr oid.tts&hl=fr Avec la synthèse vocale Google, le texte qui s'affiche à l'écran dans les applications est lu à voix haute. Exemples d'utilisation : Lecture à voix haute de vos livres préférés sur Google Play Livres Lecture à voix haute des traductions sur Google Traduction pour connaître la prononciation des mots Lecture de commentaires audio sur TalkBack et sur les applications d'accessibilité de votre appareil Utilisation dans de nombreuses autres applications du Play Store

1. Dans quels types de projets a-t-on besoin de linguistes spécialisés en TAL? 1. Les projets en relation avec la production où la modification de texte: La correction orthographique automatique La traduction automatique 2. Les projets en relation avec le traitement du signal: La synthèse de la parole (ex: Microsoft Reader, GPS) La reconnaissance vocale (ex: SVOICE, SIRI) 3. Les projets en relation avec l'extraction d'information: La recherche d information L analyse d opinion La veille technologique

La reconnaissance vocale Logiciel dictée vocale téléphone mobile Reconnaissance vocale intégrée sur les ordinateurs: http://youtu.be/t-jci5mmtzs La maison connectée: http://www.frandroid.com/produitsandroid/accessoires-objetsconnectes/258140_commande-vocale-ok-google-nestbientot-disponible

1. Dans quels types de projets a-t-on besoin de linguistes spécialisés en TAL? 1. Les projets en relation avec la production où la modification de texte: La correction orthographique automatique La traduction automatique 2. Les projets en relation avec le traitement du signal: La synthèse de la parole (ex: Microsoft Reader, GPS) La reconnaissance vocale (ex: SVOICE, SIRI) 3. Les projets en relation avec l'extraction d'information: La recherche d information L analyse d opinion La veille technologique

Les projets en relation avec l'extraction d'information Aux origines du TAL, recherche de modèles génériques de compréhension des textes: reste pour l instant une utopie L extraction d information vise à extraire d un texte donné des éléments pertinents Objectif est d obtenir des informations en vue d'une application précise Exemples d application: Le dialogue homme-machine (trouver des mots clés pour répondre à des questions) L analyse de sentiment sur les blogs, les réseaux sociaux... Participation au développement du web sémantique (ex: wikidata, DBPedia)

2. Parcours universitaire Bac S (2004) Préparation concours d orthophonie (2004-2006) Licence de Sciences du langage Université Paris X (2006-2009) Master 1 Ingénierie Linguistique Université Paris X (2010) Master 2 Recherche Ingénierie Linguistique Université Paris X (2011) Stage de 6 mois en entreprise (Syllabs, startup spécialisée dans la sémantique pour le web)

3. S inscrire en thèse? Après le Master 2, que faire? S orienter vers l entreprise ou vers le recherche? La thèse est aussi une expérience professionnelle Comment financer sa thèse? En travaillant sur un projet de recherche de l ANR (Agence nationale de la recherche) Avec une allocation doctorale d une université Avec un contrat CIFRE (thèse à 50% en entrerpise)

4. Exemple d un projet de TAL: annotation de dépêches de presse pour une utilisation dans un système de Recherche d Information (RI)

Un système de recherche d'information pour des journalistes

Quelles données pour ce type de système?

Comment produire les annotations?

Comment produire les annotations? A partir des analyse syntaxique (arbre), utilisation de règles définies par le linguiste pour «découper» les phrases en segments. Ce découpage forme se que l on nomme des annotations. Les annotations sont enregistrées dans un fichier de sortie qui est en suite utilisé par le système de Recherche d Information. Exemple 1. " [L'administration Obama] source 1 semble indice 1 [maintenant hésiter entre un vrai soutien aux doléances des Egyptiens, ou bien un retour à la stabilité avec une apparence de changement] seg_em 1 " seg_em 2, a dit indice 2 [l' élu démocrate] source 2. Légende Indice d ouverture Segment EM 1 Segment EM 2 Source

Informations sur la formation Pour des informations sur le cursus SDL qui vous permettrait d accéder à ces métiers, consulter les pages des masters Ingénierie Linguistique de l université Paris Ouest: Master Recherche Ingénierie Linguistique : http://dep-sdl.u-paris10.fr/departement-des-sciences-du- langage/master-ingenierie-linguistique- 285324.kjsp?RH=sdl_masters http://www.tal.univ-paris3.fr/plurital/master.html Master Pro DEFI : http://dep-sdl.u-paris10.fr/departement-des-sciences-dulangage/master-documents-electroniques-et-flux-d-informationsdefi-br-deuxieme-annee-122356.kjsp?stnav=&rubnav=/%22 L AFTAL (Association des anciens étudiants en TAL) : http://tal.univ-paris3.fr/aftal/

Merci de votre attention Avez-vous des questions Sur les applications du TAL Sur les parcours universitaires Sur la thèse...