TER Master 1 (FMIN 200) Cahier des charges: Oracle Lexical



Documents pareils
Raja Bases de données distribuées A Lire - Tutoriel

Compte-rendu de projet de Système de gestion de base de données

Ecole Polytechnique de Louvain INGI Fichiers et bases de données

Serveur de travail collaboratif Michaël Hoste -

Projet ISN - dossier réalisé par Randrianarimanana Stéphanie. Titre du projet : Site de rencontre. le nom de notre site de rencontre : Linkymeet

SweetyPix, mode d'emploi

CINEMATIQUE DE FICHIERS

Clauses d'hébergement web

Logiciel EV3 LEGO MINDSTORMS Education

Service WEB, BDD MySQL, PHP et réplication Heartbeat. Conditions requises : Dans ce TP, il est nécessaire d'avoir une machine Debian sous ProxMox

Client Kiwi Backup : procédures d'installation et de mise à jour. Gilles Arnoult, Clément Varaldi

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

TP : Shell Scripts. 1 Remarque générale. 2 Mise en jambe. 3 Avec des si. Systèmes et scripts

PROCEDURE D HEBERGEMENT D UN SITE WEB

Tutoriel Drupal version 7 :

Conception d'un système d'information WEB avec UML Par Ass SERGE KIKOBYA

Année Universitaire 2009/2010 Session 2 de Printemps

Check-list de maintenance du système Instructions impératives pour l'utilisateur du système Dernière mise à jour 09 juin 2011

Télécom Nancy Année

Dans la série Les tutoriels libres présentés par le site FRAMASOFT. AGORA-Projet. système de partage d'information et de travail collaboratif

Année : Team-War Jaafar AMRANI-MESBAHI Fabien GARCIA Abdelali NAIT BELKACEM Rahma NAKARA Philippe NGUYEN

Fiche méthodologique Rédiger un cahier des charges

SERVEUR DE MESSAGERIE

Éléments d'architecture des ordinateurs

CAHIER DE S CHARGE S Remote Workload Manager

Web & Libre. Outils pour être présent sur le net librement

Hébergement WeboCube. Un système performant et sécurisé. Hébergement géré par une équipe de techniciens

Outil de gestion et de suivi des projets

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed

Projet d'infrastructure Cloud

Présentation Générale

Gestion collaborative de documents

Conditions : stage indemnisé, aide au logement possible, transport CEA en Ile-de-France gratuit.

Virtualisation de Windows dans Ubuntu Linux

Enquête 2014 de rémunération globale sur les emplois en TIC

Projet Personnalisé Encadré PPE 2

Processus de Développement Logiciel

Gestion de projet. GanttProject Didacticiel V novembre Gérard Gervois Frédéric Giamarchi

Premiers pas sur e-lyco

Offre de services. PHPCreation Inc. - Date : Présenté à : À l'attention de : Représentant :

Processus de Développement Logiciel


claroline classroom online

Utilisation du module Scribe IMPORTATION DES COMPTES

MS PROJECT Prise en main. Date: Mars Anère MSI. 12, rue Chabanais PARIS E mail : jcrussier@anere.com Site :

Création d'un questionnaire (sondage)

Espace numérique de travail collaboratif

Contrat d'hébergement application ERP/CRM - Dolihosting

Activité sur Meteor. Annexe 1 : notion de client-serveur et notion de base de données

Le stockage local de données en HTML5

Louer et utiliser un Hébergement Mutualisé OVH (Version 1.0)

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

SOMMAIRE. Savoir utiliser les services de l'ent Outils collaboratifs

Charte informatique. Ce document n est qu un exemple. Il doit être adapté à chaque entreprise selon ses moyens et ses nécessités.

A5.2.4 Étude d une technologie, d'un composant, d'un outil

Rapport de stage. Création d un site web. Stage du 20/01/2013 au 21/02/2013

Intégration d'un moteur de workflow dans le SI : Dématérialisation des Ordres de misson

THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL

CONDITIONS PARTICULIÈRES DES HÉBERGEMENTS MUTUALISES DE SITES INTERNET

SERVEUR DE MESSAGERIE

Intranet d'établissement avec Eva-web Installation configuration sur serveur 2000 ou 2003 Document pour les administrateurs

Déployer des Ressources et des Applications sous Android.

DA MOTA Anthony - Comparaison de technologies : PhoneGap VS Cordova

Espace FOAD IRTS Guide de l étudiant Septembre 2009

Plan de notre intervention 1. Pourquoi le test de charge? 2. Les différents types de tests de charge 1.1. Le test de performance 1.2.

Chamilo Manuel Administrateur. Guide de l'administrateur. Chamilo janvier 2012 Page 1 / 108

Création d'un site dynamique en PHP avec Dreamweaver et MySQL

Un ENT est un espace de travail pour les enseignants et la direction mais aussi

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

Les ateliers EPN 2015/2016

Espaces probabilisés

CAHIER DES CHARGES D IMPLANTATION

Guide d'installation

Couples de variables aléatoires discrètes

Qu'est ce que le Cloud?

Faulconnier Bastien SIO2. Cahier des charges. Choix et mise en œuvre d'un datacenter pour Infrastructure Cloud. Pour la société :

Conception de circuits numériques et architecture des ordinateurs

Microsoft OSQL OSQL ou l'outil de base pour gérer SQL Server

BTS SIO SISR3 TP 1-I Le service Web [1] Le service Web [1]

Formation SCRIBE EAD

Un serveur web, difficile?

La version 3.0 de Corman S

Programmation Web. Introduction

Perl Console. Votre compagnon pour développer en Perl. Les Journées du Perl , 17 novembre, Lyon. Alexis Sukrieh

Deuxième partie. Approche globale d'implémentation d'un projet PLM

OwnCloud. Définition 1 / 10. Date d'édition 03/09/2013 Public concerné Étudiants, Personnels Version du logiciel

DROPBOX. Stocker et partager des fichiers avec

Méthodes de développement. Analyse des exigences (spécification)

MOTEUR DE WORKFLOW Mise en oeuvre d'openwfe Version septembre 2006

Conditions d'utilisation de la version gratuite

Ordonnancement. N: nains de jardin. X: peinture extérieure. E: électricité T: toit. M: murs. F: fondations CHAPTER 1

Débuter avec OOo Base

LANGAGUE JAVA. Public Développeurs souhaitant étendre leur panel de langages de programmation

CONNECTEUR PRESTASHOP VTIGER CRM

Entrainement à l'évaluation des acquis Windows 2008 R2 et Active Directory

Configurer (correctement) le service DNS pour Mac OS X Server

Alain Téfaine 02/07. Comment utiliser le logiciel CVitae pour rédiger votre CV?

Transcription:

TER Master 1 (FMIN 200) Cahier des charges: Oracle Lexical VEYSSIER Julien, BISQUERT Pierre PAIVA LIMA DA SILVA Bruno, BELMONTE Remy - Encadrant : Mathieu Lafourcade 6 février 2009 Université Montpellier 2 1

2 TER M1 2009 Groupe I Table des matières 1 Introduction 3 1.1 Présentation du sujet....................... 3 1.2 Motivations............................ 3 1.3 Besoins............................... 4 1.4 Contraintes............................ 4 2 Solution envisagée 5 3 Organisation du travail 5 3.1 Communication.......................... 5 3.2 Travail............................... 6 4 Liens et Références 7 5 Diagramme de Gantt 8

3 TER M1 2009 Groupe I 1 Introduction 1.1 Présentation du sujet Ce TER a plusieurs objectifs qui tournent tous autour d'un but commun, obtenir des données lexicales de qualité et les utiliser dans une interaction entre un humain et un programme. Le premier objectif est de développer un oracle lexical. Un oracle est vu dans la grèce antique comme la réponse d'une divinité à une personne venue la consulter. Par extension, le mot oracle désigne aussi le lieu ou la divinité qui donne la réponse. Dans notre cas, l'oracle est une application web qui permet de retrouver un mot que l'on aurait oublié en se servant d'indices fournis par l'utilisateur. Cet oracle se servira de données lexicales pour arriver à fournir une réponse correcte à son "dèle". Le deuxième objectif est de développer un jeu de devinette. Dans ce jeu, l'utilisateur devra deviner un mot choisi par l'ordinateur. Des mots ou indices lui seront proposés les uns après les autres jusqu'à ce qu'il trouve la bonne réponse. Toute réponse pourra aussi aider à créer des données lexicales. Le troisième objectif est d'améliorer l'oracle en permettant à l'utilisateur de proposer un mot en cas d'échec de la part du programme. Le quatrième objectif est de pouvoir créer ou obtenir des données lexicales en eectuant de la fouille de texte. Une fouille doit pouvoir fournir des données exploitables par le jeu de devinette et par l'oracle. L'oracle et le jeu de devinette seront accessibles sur le web dans le but de faire participer un maximum de personnes à l'alimentation de nos données et d'obtenir une grande diversité dans les informations récoltées. 1.2 Motivations Notre première et principale motivation est bien évidemment de se mettre en condition réelle de production de logiciel qui nous permettra, à n'en pas douter, de développer notre esprit d'analyse et notre capacité à nous plonger dans un sujet orienté sur la voie de la recherche. De plus, nous souhaiterions réussir à produire un logiciel qui soit utilisable dans un cadre "réel", c'est à dire pouvant être réellement utile à une personne, notamment dans le fait d'aider à retrouver un mot ; permettant ainsi

4 TER M1 2009 Groupe I de dépasser la simple conception répondant à un sujet. Par ailleurs, nous aspirons à créer, par le biais de ce sujet, une base de données lexicales utilisable tout d'abord par notre programme mais étant également une source de données alternative pour des sujets de recherche de Monsieur Lafourcade, et pour le TALN (Traitement Automatique du Langage Naturel) en général, permettant, de la même façon que nous protons de leurs données et méthodes, de leur faire proter des notres. 1.3 Besoins Le principal besoin en premier lieu est de pouvoir disposer d'une base de donnée lexicales pré-existante, nous orant une fondation solide à la création de l'oracle proprement dit. Monsieur Lafourcade nous a, à ce titre, fourni les données de sa base de données lexicales issues du jeu "Jeux De Mots" (http : //www.jeuxdemots.org). Cette base d'origine sera, à terme, remplacée par notre propre base, créée à partir de l'oracle lui-même. Nous avons aussi besoin d'un serveur web et d'un système de gestion de bases de données. Nous avons choisi d'héberger nous même ces services sur le domaine aiur.fr qui nous appartient. 1.4 Contraintes Les contraintes sont tout d'abord de l'ordre de l'accessibilité : il est en eet important de permettre un accès rapide et simple à l'oracle. Une application web est donc un choix très intéressant. Ceci nous permettra de plus de tenir à jour notre base de données lexicales plus aisément. Ce choix d'une application web implique donc d'être vigilant et de prendre en compte la sécurité du site, pour éviter par exemple la triche lorsque l'utilisateur s'adonnera à la partie "jeu" du site (modication des points) ou encore un accès illicite à la base de données lexicale. Les résultats 1 devront êtres transmises à notre encadrant ou bien sous la forme de dump SQL 2, ou bien via une page web avec un formulaire permettant des consultations de la base de données en tant réel. 1 les données obtenues 2 chier de sauvegarde des données présentes dans un SGBD

5 TER M1 2009 Groupe I 2 Solution envisagée En ce qui concerne l'application web, nous utiliserons Apache2 et MySQL ainsi que le langage PHP pour la programmation. Comme alternative au PHP, se présente le langage Python, langage lequel nous pourrons utiliser au cas où nous ayons besoin de développer des programmes au-delà des limites du PHP. Le jeu que nous allons réaliser devra être attirant et facile à utiliser. Il comportera un système de points incitant le joueur à jouer correctement et fréquemment. Ces points pourront être comparés à ceux des amis du joueur. De plus, un travail sera certainement eectué quant à l'apparence graphique du jeu ; elle devra être personnalisable tout en restant sobre. Evidemment, nous envisageons de partir dans une optique "communautaire" ou chaque utilisateur peut avoir un compte qui maintient ses informations d'une session à l'autre. Ceci permettra à une personne inscrite d'établir une liste d'amis dont elle pourra consulter les scores. Un classement sera éventuellement af- ché dans l'espace de chaque utilisateur, l'ensemble de ces idées étant mises en place de façon à rentre le jeu plaisant et addictif, ce qui permettrait, en retour, de pouvoir obtenir une bonne quantité de données lexicales à partir des parties d'utilisateurs. N'ayant pas terminé l'analyse en profondeur de chaque point à traiter, nous nous laissons le temps et la possibilité d'ajuster ou d'introduire des nouvelles tâches et fonctionnalités au cours du projet. 3 Organisation du travail 3.1 Communication Le début de l'organisation du travail a commencé bien avant le début de la rédaction de ce cahier des charges. Pour assurer qu'il n'y ait aucun problème de communication au sein de l'équipe de travail (étudiants + encadrant), nous nous sommes tout d'abord réunis à l'université entre étudiants pour trouver un accord commun quant aux diérentes modalités de communication et échanges qui arriveront au cours du projet. Lors de cette réunion, il a été décidé l'utilisation de mail, logiciels de messagerie instantanée, un dépot en ligne sous un logiciel de gestion des sources, ainsi qu'une interface de gestion de projet en ligne avec plusieurs options

6 TER M1 2009 Groupe I comme une vision de l'avancement du projet ainsi qu'un système d'échange de messages entre les participants du projet. Entre les étudiants et l'encadrant du projet, des échanges de coordonnées pour contact ont eu lieu nous permettant d'être en synchronie avec l'encadrant et d'avoir diérents de moyen de contact étant donné ses autres nombreuses occupations. Quelques rencontres (réunions) de discussion autour du projet ont eu lieu avant la rédaction de ce cahier. 3.2 Travail Avant un début de développement, une phase d'analyse sera réalisée avec la participation de l'ensemble du groupe. Des questions comme comment stocker nos données, quel nom donner à nos diérentes structures, et comment mettre en relation les plusieurs parties de notre projet seront donc posées dès la première semaine de travail, et seront résolues avec l'accord et surtout le travail de tous les intégrants du groupe an qu'il y ait une compréhension collective et sans aucun problème de la base du projet par chacun. Suite à cela, une stratégie devra être choisie pour permettre l'emmagasinement des diverses données lexicales dont nous souhaitons vérier à tout moment et récupérer à la n du projet pour une analyse postérieure. Après un choix de stratégie par le groupe, celle-ci sera présentée à l'encadrant, qui vériera et certiera au début sa cohérence et sa qualité, et qui, dans un second temps, nous indiquera si cette stratégie est bien pertinente pour permettre une récupération de données lexicales réellement exploitables à la n de ce projet. Ces deux points traités, nous passerons donc à la suite du projet, où des tâches bien spéciques seront attribués à chacun et dont le travail sera mis en commun au fur et à mesure, suivant l'avancement du projet. Les tâches seront divisées selon les goûts et préferences de chacun, et seront au total au nombre de 4, chaque partie étant assignée à un intégrant du groupe. Ces parties englobent : Développement du "Devineur", l'application utilisant l'oracle pour retrouver un mot selon des indices Développement du jeu et du système de vérication des données lexicales récupérées par celui-ci

7 TER M1 2009 Groupe I Développement et mise en place du "fouilleur" de données pour ajouter des données actuelles à la base Ainsi qu'une partie de création et d'ammélioration d'une interface graphique de qualité pour les utilisateurs Même si la division de ces parties entre les intégrants du groupe est pratiquement faite, nous attendrons notre première réunion après les parties communes initiales de travail prêtes et dénies en tant que dénitives pour choisir et valider une séparation eective du projet selon les choix, volontés et anités de chacun avec chaque partie. 4 Liens et Références Voici une liste de quelques pages web en relation directe ou indirecte avec notre projet : Jeux De Mots (http : //www.jeuxdemots.org) Akinator, le génie du Web (http : //www.akinator.com/aki_f r/)

8 TER M1 2009 Groupe I 5 Diagramme de Gantt