Projets Professionnels - Master IdL 2014-2015



Documents pareils
: seul le dossier dossier sera cherché, tous les sousdomaines

T2GC. Enseignement secondaire technique Régime de la formation de technicien. Date: ANGLA6. Anglais 6

MASTER LPL : LANGUE ET INFORMATIQUE (P)

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches

Installer Joomla Pearson France Joomla! Le guide officiel Jennifer Marriott, Elin Waring

ACTIVITÉS DE COMMUNICATION LANGAGIÈRE ET STRATÉGIES

Formation Août 2013 Michèle Garello, IEN économie gestion Caroline Natta, professeur

SharePoint 2013 L'environnement de travail collaboratif

Manuel d Utilisation Nouvelle Plateforme CYBERLIBRIS : ScholarVox Management

Document d aide au suivi scolaire

UE5 Mise en situation professionnelle M1 et M2. Note de cadrage Master MEEF enseignement Mention second degré

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

CAHIER DES CHARGES de la formation : «Excel pour les bibliomètres»

N SIMON Anne-Catherine

Approches innovantes vers le Cloud, la Mobilité et les outils sociaux de formation

TECHNIQUES DE SURVIE ÉCRITURE Leçon de littératie 2.6

BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS

Allègement des tâches administratives

Demande d admission au Centre pédagogique Lucien-Guilbault Secteur primaire

Ministère de l Éducation Guide de l utilisateur de l Initiative pilote des écoles vertes

Document à l attention de l enseignant Grande section

On trouvera sur le site du CCDMD un exemple d album construit avec Cantare. (

Et si j étais Marty Mac Fly Ou comment remonter le temps avec une tablette tactile (Ipad)

Acrobat XI pour PC/Mac (version Pro) Pour qui, pourquoi et comment fabriquer un PDF?

10 REPÈRES «PLUS DE MAÎTRES QUE DE CLASSES» JUIN 2013 POUR LA MISE EN ŒUVRE DU DISPOSITIF

Activité collaborative en ligne. Isabelle GRAND, IAE/IUP Santé

Speexx Basic Anglais, Français, Allemand, Italien, Espagnol,

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

Manuel d Administration

Plateforme AnaXagora. Guide d utilisation

Competence Management System (Système de Gestion de Compétences)

Niveaux débutant & Intermédiaire Word 2010

Débuter avec Easyweb B

SERVICE CERTIFICATION DES ÉTABLISSEMENTS DE SANTÉ. Guide utilisateur Compte Qualité dans SARA

AnaXagora LMS v3.0. Guide d utilisation

BeLearner.com, en 5 leçons!

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement Chavanod

Direction des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal

Initiation à la bureautique

Installation / Sauvegarde Restauration / Mise à jour

Rapport de stage. Création d un site web. Stage du 20/01/2013 au 21/02/2013

FEN FICHE EMPLOIS NUISANCES

Business Intelligence avec Excel, Power BI et Office 365

MAITRISER LE BLENDED LEARNING EN 4 ÉTAPES

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed

Se former pour réussir!

Université de Lorraine Licence AES LIVRET DE STAGE LICENCE

DESCRIPTEURS NIVEAU A2 du Cadre européen commun de référence pour les langues

Formation Tutorée A Distance (FTAD) en BUREAUTIQUE

PROJET TOUR EDUCALL USB par CDPRO

PRÉSENTATION GÉNÉRALE

P R E S E N T A T I O N E T E V A L U A T I O N P R O G R A M M E D E P R E V E N T I O N «P A R L E R»

PACK NUMERIQUE EDUCATION GUIDE UTILISATEUR

Organisation des enseignements au semestre 7

BIRT (Business Intelligence and Reporting Tools)

Projet d école Guide méthodologique

d un site web universitas friburgensis Objectifs de l atelier

Usages pédagogiques des tablettes

Manuel du gestionnaire

Programme de la formation. Écrit : 72hdepréparation aux épreuves d admissibilité au CRPE

Spécialité auxiliaire en prothèse dentaire du brevet d études professionnelles. ANNEXE IIb DEFINITION DES EPREUVES

institut national de jeunes sourds de Paris

OFFRE MDB Service & Architecture Technique. MyDataBall Saas (Software as a Service) MyDataBall On Premise

Diffuser un contenu sur Internet : notions de base... 13

Bienvenue à l historien virtuel 2.0

Livret du Stagiaire en Informatique

UFR d Informatique. FORMATION MASTER Domaine SCIENCES, TECHNOLOGIE, SANTE Mention INFORMATIQUE

SOMMAIRE... 1 ESPACE DU CLUB...

(CC )

CREG : versailles.fr/spip.php?article803

Catalogue des formations pour vos collaborateurs, pour vos clients,

Technologies du Web. Créer et héberger un site Web. Pierre Senellart. Page 1 / 26 Licence de droits d usage

Archiviste - Documentaliste / Gestionnaire de l information / Consultant en archives et documentation

Création, analyse de questionnaires et d'entretiens pour Windows 2008, 7, 8 et MacOs 10

INTERWRITE WORKSPACE

GEDEXPERT. La Gestion Electronique de Documents des PME PMI. VOTRE NOUVEL ASSISTANT pour. Pour partager l information au sein de l entreprise

La salle de classe en ligne de l Apprentissage en ligne :

ÉCOLE SECONDAIRE PÈRE-RENÉ-DE-GALINÉE

MEDIAplus elearning. version 6.6

DataCar CRM V2.3. CRM V2.3 Release Notes Production. DataCar CRM v2.3. Release Notes

PRISE EN MAIN RAPIDE

LES REFERENTIELS DES TROIS BACCALAUREATS PROFESSIONNELS DU TERTIAIRE COMMERCIAL VENTE COMMERCE SERVICES

Accès instantané aux mots et aux locutions Le dictionnaire électronique offre une traduction rapide d'un mot ou d'une locution

ScolaStance V6 Manuel vie scolaire

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure

Description du programme du Master M2 MIAGE SIIN (1)

GEDEXPERT. La Gestion Electronique de Documents spécialement conçue pour les Experts Comptables VOTRE NOUVEL ASSISTANT POUR

Voyez clair dans vos finances avec AccèsD Affaires

VOLUME 1 CRÉATION D UN SITE WEB

GUIDE UTILISATEUR DHL FREIGHT E-BILLING LA FACTURATION ELECTRONIQUE PAR DHL FREIGHT

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Utiliser un tableau de données

OPTION SCIENCES BELLE-ISLE-EN-TERRE

Le Test d évaluation de français De la Chambre de commerce et d industrie de Paris

INFORMATIQUE & WEB. PARCOURS CERTIFICAT PROFESSIONNEL Programmation de sites Web. 1 an 7 MODULES. Code du diplôme : CP09

PRESENTATION. Parcours de formation à distance A destination des personnels en contrats aidés

CMS Modules Dynamiques - Manuel Utilisateur

Transcription:

Projets Professionnels - Master IdL 2014-2015 Enseignant - coordinateur : Thomas Lebarbé Stendhal, Université Grenoble-Alpes 1 Préambule Dans les pages qui suivent vous trouverez une liste de projets proposés par des enseignants ou des chercheurs en lien avec le traitement automatique des langues. Ils revêtiront le rôle de commanditaires et ne sont pas là pour vous aider à mener à bien votre projet. Quand vous aurez sélectionné le projet qui vous convient (thématique, compétence linguistique, didactique et technologique), vous prendrez contact avec votre commanditaire afin de définir avec plus de précision ses attentes. Vous lui remettrez un cahier des charges qu il validera (ou pas). A partir de la validation, le commanditaire vous aura fourni tout le matériau dont vous aurez besoin et il ne pourra en aucun cas revenir sur le cahier des charges. 2 Calendrier 21/10/2014 Présentation des projets 06/11/2014 Choix des projets par les étudiants. 11/12/2014 Soumission des cahiers des charges. 18/12/2014 Acceptation des cahiers des charges par les commanditaires. 19/02/2015 Rendu des projets, documentations et manuels. 26/02/2014 Soutenance publique. 3 Évaluation Le travail de projet professionnel est évalué par équipe en deux temps : Semestre 1 : travail avec le(s) commanditaire et cahier des charges Semestre 2 : production ( 1 3 ), documents ( 1 3 ), soutenance ( 1 3 ) 1

4 Projets 4.1 Une plateforme pour des études expérimentales sur la littéracie avancée. Commanditaire : Mme Fanny Rinck fanny.rinck@ujf-grenoble.fr Objectif : développer une plateforme pour des chercheurs qui étudient les compétences de lecture et d écriture à un niveau avancé (par ex. chez des étudiants ou des cadres) et qui souhaitent mettre en place des tests accessibles en ligne. La plateforme doit comporter deux accès : un pour les utilisateurs qui passent le test, l autre pour l expérimentateur qui crée le test en insérant diverses questions. Elle doit permettre de récupérer des données sous la forme d un tableur (en ligne les personnes qui passent le test, en colonne les différentes questions posées). Etape 1 : Les tests comportent des questions de type case à cocher et des questions ouvertes. Ils consisteront par exemple à juger si un énoncé est correct ou non, s il est plus ou moins acceptable dans un écrit formel ou non, ou à choisir entre trois énoncés lequel est le plus acceptable). Ils seront précédés de questions sur les sujets passant le test (sexe, âge, niveau d études et profession, langue maternelle etc.). Etape 2 : Les tests consistent à soumettre aux sujets de courts extraits de textes (narratifs, argumentatifs) et à leur demander d effectuer des opérations, par exemple surligner les verbes ou les fautes d orthographe. Le tableur doit permettre d extraire ce qui a été surligné (ou souligné) par l utilisateur. Attention, il faut prévoir la possibilité d une sélection multiple, dans le cas par ex. d un groupe verbal comme dans «Il n est pas venu». Etape 3 : Les tests consistent à soumettre aux sujets de courts extraits de textes et à leur demander des commentaires sur un élément ou un passage du texte qu ils mettront en surbrillance (ex. «terme mal choisi», «pas clair»). Le tableur doit permettre d extraire ce qui a été surligné (ou souligné) par l utilisateur et le commentaire associé. 2

4.2 Outil d alignement automatique de productions orales enfantines Commanditaires : Mme Aurélie Nardy Mme Solange Rossato aurelie.nardy@u-grenoble3.fr solange.rossato@u-grenoble3.fr Objectif : Développer un outil permettant un alignement automatique de productions orales enfantines à une transcription manuelle. Il s agit d obtenir un premier «jet» de transcription orthographique alignée qui servira par la suite de support à une analyse semi-automatique des variantes de prononciation. Point de départ : L alignement se fera à partir de fichiers audio de productions orales d une douzaine enfants de CM2 recueillies dans le cadre du projet DEVCOMP (Développement de la compréhension des textes : analyse des habiletés sous-jacentes et construction d un outil d évaluation), coordonné par Maryse Bianco (Laboratoire des Sciences de l Éducation, Univ. Grenoble Alpes) et financé par l Agence Nationale de la Recherche. La transcription de ces fichiers a été faite manuellement et servira pour le développement de l outil. Les enregistrements consistent en des verbalisations d auto-explication. Les enfants ont eu pour consigne de lire un texte à haute voix et d interrompre leur lecture après chaque paragraphe pour dire oralement ce qu ils avaient compris du passage qu ils venaient de lire. À la fin de la passation, il était également demandé aux enfants de rappeler l histoire qu ils avaient lue. Ce protocole a été passé par chacun des enfants avec deux textes différents. L outil d alignement sera fondé sur le projet KALDI 1. Il s agira de : normaliser les transcriptions établir une procédure de découpage des fichiers audio proposer des formats d export des transcriptions manuelles vers KALDI aligner la transcription sur le signal audio vérifier l alignement proposer un format de sortie d alignement compatible avec PRAAT et ELAN (par exemple, type easyalign) proposer un fonctionnement de l outil via une interface en ligne 1. http://kaldi.sourceforge.net/about.html 3

Prolongements possibles Adaptation des modèles acoustiques aux voix d enfants Faire une évaluation sur les enregistrements 4.3 Innova s Up Commanditaires : Mme Virginie Zampa M. Mathieu Loiseau virginie.zampa@u-grenoble3.fr mathieu.loiseau@u-grenoble3.fr Objectif : Au sein du projet Innovalangues, nous aimerions disposer d un jeu style deux premières manches de time s up/tabou en ligne en français et en anglais. Le jeu doit être conçu comme un jeu communautaire asynchrone. Les mots de départ sont : soit sélectionnés par un enseignant (partie donnée par lui à des étudiants), soit choisis aléatoirement, soit fournis par les joueurs. Le jeu est minuté et les points sont comptés. Il existe un classement et/ou un score de compétence des joueurs qui indique le nombre de points total, le nombre de points en moyenne par partie, les scores minimal et maximal, etc. Les fautes de jeu (emploi de mot tabou, utilisation d une autre langue que celle de la partie, etc.) de la personne qui «fait deviner» sont détectées par les joueurs eux-mêmes qui gagnent des points quand ils le font. Existant : Innovalangues dispose déjà d outil pour enregistrer du son depuis le navigateur, le lire et le transmettre à un serveur. Ces outils seront réutilisés dans ce projet. Les plus envisageables : ajouter une correction, c est à dire pour les mots proposés qui ne sont pas dans le dictionnaire, fournir la liste des mots les plus «proches» ; créer un dictionnaire des mots trouvés pour chaque joueur permettant d accéder directement à leur définition ; création et/ou usage de ressources sémantiques (cf. diko de «jeu de mots», réseaux sémantiques, etc.) pour des règles «à la tabou» Etc. 4

4.4 Création d un signaire collaboratif Commanditaires : Mme Lucie Metz Mme Virginie Zampa virginie.zampa@u-grenoble3.fr lucie.metz1@gmail.com Ce projet professionnel vise la création d un dictionnaire des signes (signaire) collaboratif, s intégrant plus largement au sein de la plateforme web destinée à l enseignement/apprentissage de la Langue des Signes Française, Plat In 2 : Tout comme pour un dictionnaire collaboratif classique, le signaire doit pouvoir avoir plusieurs signes pour un même concept. Le projet se compose de trois parties : Dépôt du signe (vidéo du signe, explication textuelle et/ou vidéo sur le signe, autres concepts liés au signe, Indexation du signe Recherche de signe Visualisation du signe souhaité Plusieurs contraintes sont à prendre en compte : L utilisateur doit pouvoir se filmer directement à partir de l interface L interface du signaire doit prendre en compte l utilisateur Un travail devra être fait sur le mode d indexation des signes Le signaire étant collaboratif, un même concept peut avoir plusieurs signes Contrainte technique : interdiction d utiliser du Flash 4.5 IFE Productions Commanditaire : M. Claude Ponton claude.ponton@u-grenoble3.fr Contexte : Dans le cadre d un travail de recherche sur l apprentissage de l orthographe mené au LIDILEM en partenariat avec l Institut Français de l Education (IFE), un corpus de productions écrites a été recueilli en classe de CP. Outre ces productions, on dispose d un ensemble de données sur l élève ainsi que sur sa classe et son enseignant (ci-après). 2. exemple d un signaire collaboratif existant : http ://lsf.wikisign.org/wiki/wikisign :Accueil 5

Actuellement, les productions ne sont pas numérisées (format papier) et les données ont été saisies dans un fichier Excel. Travail à réaliser : Il s agit de concevoir et de développer un outil permettant l exploitation et la saisie pour Importer les données descriptives Excel Permettre la saisie des productions écrites Proposer des visualisations des données Proposer un ensemble de statistiques sur les données Permettre des extractions (txt, csv) Données : Variables de niveau 1 (élèves) sexe mois et année de naissance code de la profession du père code de la profession de la mère langue parlée à la maison redoublement du CP élève qui ne parlait pas français à l entrée en CP modalités de la prise en charge des élèves en difficulté : maitre E (durée estimée en heures) maitre G (durée estimée en heures) aide personnalisée ou APC, activités pédagogiques complémentaires (durée estimée en heures) auxiliaire de Vie Scolaire (en nombre d heures hebdomadaires) PPRE (programme personnalisé de réussite éducative) MDPH (maison départementale pour les personnes handicapés) Orthophoniste Variables de niveau 2 (classe) nombre d élèves dans la classe niveau : CP ou cours multiples (par ex CP-CE1) composition sociale de la classe : éducation prioritaire, défavorisée, mixte, favorisée utilisation d un manuel de lecture Variables enseignant sexe année de naissance niveau de diplôme discipline du diplôme 6

ancienneté dans le métier d enseignant ancienneté en CP expérience éventuelle de formateur 4.6 Classification lexico-morpho-syntaxique pour l?adaptation de la reconnaissance vocale de commandes reformulées en oral spontané Commanditaires : Mme Véronique Aubergé M. Frédéric Aman veronique.auberge@imag.fr frederic.aman@gmail.com Dans le cadre d un collaboration LIG-société Awabot. Dans le corpus EEE collecté dans l?habitat Intelligent Domus, un souscorpus regroupe toutes les reformulations spontanées produites par les sujets autour des 20 commandes typiques de la domotique de l?habitat (ex : pour «mettre la lumière» sont produites les variantes «mettre la lampe» «allumer la lumière»«on met la lumière» «tu veux bien mettre la lumière» etc.) Ces paraphrases sont adressées à un robot et varient dans leurs formes selon l?évolution du lien avec le robot : le but global à terme, pour la brique de reconnaissance vocale, est de (1) rendre robuste la reconnaissance à l?identification de la commande reconnaissance (cad filtrer les «variantes» paraphrasiques) (2) reconnaître quel est le degré du lien sur plusieurs indices incluant le type de variante paraphrasique. Ce projet a pour but de préparer la construction de cette brique de reconnaissance interactionnelle en construisant un outil de typologisation des énoncés qui favorisera l?établissement du filtre du modèle de langage du système de reconnaissance vocale de la commande, et ensuite fera e contraposé émerger la structure typologiser en la «soustrayant» de la commande typique. Cet outil devra essentiellement produire, uniquement dans cet espace restreint de variantes paraphrases et périphrases, des mesures de distance entre variantes lexico-morpho-syntaxiques qui incluent les dimensions de distance, par rapport à la référence typique, de l?ordre syntagmatique, paradigmatique, lexical para-lexical et temporel (cad place de l?énoncé dans le dialogue). 7

4.7 Misheng, catégoriseur de textes en chinois mandarin Commanditaire : M. Yoann Goudin yoann.goudin@u-grenoble3.fr Contexte : Parmi les six langues du projet Innovalangues, l équipement du chinois mandarin nécessite le développement d outils spécifiques aux paradigmes didactiques et pratiques pédagogiques dominants. Vaguement adossée au CECR, la progression en langue est fondamentalement et «universellement» basée sur la maîtrise de n sinogrammes par niveau et par conséquent la connaissance ou non du sinogramme x pour positionner ou certifier un apprenant. Le corollaire de cette idéologie renforce la représentation ultradominante en didactiques des langues étrangères tant dans la communauté enseignante que parmi les apprenants, selon laquelle un texte aurait donc «un niveau». La quadrature du cercle réside par conséquent dans une impossibilité d exploiter des documents authentiques du fait de l emploi de sinogrammes «hors-programmes» dans chaque texte. Objectifs : La motivation de notre proposition repose sur le détournement de ce paradigme en adaptant et développant un outil équivalent déjà existant en japonais (cf. annexes) : un catégoriseur de textes. Cet outil permet à son utilisateur de vérifier la fréquence des sinogrammes utilisés et ainsi d avoir une idée de la probabilité que le lexique de ce texte soit connu et/ou accessible à l apprenant. Intégrable à l ENPA (Environnement Numérique Personnalisé d Apprentissage) développé par Innovalangues, il s agit d un outil en ligne qui sera à terme en lien avec le dictionnaire personnel de l apprenant de l ENPA. L utilisateur doit pouvoir choisir : entre des listes clairement identifiées ou alors des combinaisons de ces dernières. constituer ses propres listes l faut prévoir un système d archivage des requêtes : utilisateur, liste(s) retenue(s) pour la catégorisation, URL d origine du texte, texte brut, texte «traité»... avec un petit moteur de recherche intégré afin de faire des requêtes au sein du corpus ainsi composé. Pour montrer la fonctionnalité de l outil, l objectif est de séduire un utilisateur extérieur (IP) à travers trois textes (archivés). Seule condition : saisir l URL du texte en plus de l extrait sélectionné. L outil sera capable de recouper automatiquement ces deux informations : que l URL renseignée 8

corresponde bien à celle du texte saisi. Au-delà de trois essais, l utilisateur devra s enregistrer via un login et renseigner un questionnaire qui permette de connaître le profil de l utilisateur (entre autres variables : apprenant/enseignant, niveau, natif ou non, etc?) et ses usages. En échange de cet enregistrement, l utilisateur a deux avantages : il a accès à son historique des textes, et peut constituer ses propres listes. Ainsi, Misheng permettra de constituer un corpus de textes authentiques recherché par les utilisateurs et ainsi proposer à la communauté des chercheurs Innovalangues un panorama des usages et une base de textes dégrossie à mettre à disposition de la communauté (enseignante et des apprenants). Par ailleurs, l outil offrira les fonctionnalités suivantes : l option de discrimination par couleur (ou gras/italique etc... ) de l appartenance de tel ou tel sinogramme en fonction du niveau mais aussi de quelle liste (pour les listes mixtes) ainsi que le distingo sinogramme actifs/passifs, ainsi que les différentes lectures... La possibilité de trier les sinogrammes du texte par type, (redondance en fonction des différentes progressions) La génération des listes des types classés par ordre alphabétique de pinyin mêmes fonctionnalités sur une base lexies un petit tutoriel trilingue (français, mandarin, anglais) est mis à disposition des utilisateurs l interface utilisateur est trilingue : français, chinois (simplifié, traditionnel), anglais Existants : Techniquement, il s agit de développer pour le mandarin un outil déjà existant réalisé par la Maître de Conférences de japonais de l INALCO (Institut National des Langues et Civilisations Orientales, Paris) NAKAMURA Yayoi DELLOYE, linguiste et ancien doctorante en TAL à ALPAGE (Paris - Diderot? INRIA). Il s agit d un script PHP qui interroge une base de données MySQL. Très concrètement, l équipe mandarin d Innovalangues a déjà recueilli au format csv les progressions d apprentissage des sinogrammes et des mots de toutes les méthodes en usage dans le secondaire et les principales universités dispensant du mandarin en LANSAD (LANgues pour les Spécialistes des Autres Disciplines). Le segmenteur et le dictionnaire seront sélectionnés en concertation avec 9

l équipe mandarin d Innovalangues et l équipe de recherche K3M. Annexes : captures d écran de l outil existant : Saisie 1 : il s agit du répertoire des différentes listes disponibles : dico libre, JLPT (test certificatif pour le japonais), INLACO (licence LLCE japonais), Paris-Diderot (licence LLCE japonais) Saisie 2 : aperçu d une des listes, lien hypertexte vers le dico libre. 10

Saisir 3 : fenêtre du vérificateur existant avant saisie du texte : choix de l établissement (de la liste), niveau maximum autorisé (discriminer les «horsprogrammes»)... et texte récupéré en ligne Saisie 4 : résultat de la requête : couleurs + numéro des leçons entre paranthèses. 11