L a complexité et la taille sans cesse



Documents pareils
Editions ENI. Project Collection Référence Bureautique. Extrait

Interface OneNote 2013

Remboursement d un emprunt par annuités constantes

EH SmartView. Identifiez vos risques et vos opportunités. Pilotez votre assurance-crédit. Services en ligne Euler Hermes

En vue de l'obtention du. Présentée et soutenue par Meva DODO Le 06 novembre 2008

ÉLÉMENTS DE THÉORIE DE L INFORMATION POUR LES COMMUNICATIONS.

METHODE AUTOMATIQUE POUR CORRIGER LA VARIATION LINGUISTIQUE LORS DE L INTERROGATION DE DOCUMENTS XML DE STRUCTURES HETEROGENES

INTERNET. Initiation à

Montage émetteur commun

Terminal numérique TM 13 raccordé aux installations Integral 33

En vue de l'obtention du. Présentée et soutenue par Elayeb Bilel Le 26 juin 2009

Réseau RRFR pour la surveillance dynamique : application en e-maintenance.

Paquets. Paquets nationaux 1. Paquets internationaux 11

ErP : éco-conception et étiquetage énergétique. Les solutions Vaillant. Pour dépasser la performance. La satisfaction de faire le bon choix.

Mesure avec une règle

Les jeunes économistes

Integral T 3 Compact. raccordé aux installations Integral 5. Notice d utilisation

Mots-clés : Système multicapteurs, Réseau local, Réseaux de neurones, Supervision, Domotique. xigences système d'une nouvelle

Des solutions globales fi ables et innovantes.

hal , version 1-14 Aug 2009

P R I S E E N M A I N R A P I D E O L I V E 4 H D

Contact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr

Pourquoi LICIEL? Avec LICIEL passez à la vitesse supérieure EPROUVE TECHNICITE CONNECTE STABILITE SUIVIE COMMUNAUTE

BTS GPN 2EME ANNEE-MATHEMATIQUES-MATHS FINANCIERES MATHEMATIQUES FINANCIERES

Professionnel de santé équipé de Médiclick!

1 Introduction. 2 Définitions des sources de tension et de courant : Cours. Date : A2 Analyser le système Conversion statique de l énergie. 2 h.

Plan. Gestion des stocks. Les opérations de gestions des stocks. Les opérations de gestions des stocks

STATISTIQUE AVEC EXCEL

Be inspired. Numéro Vert. Via Caracciolo Milano tel fax

RAPPORT DE STAGE. Approcher la frontière d'une sous-partie de l'espace ainsi que la distance à cette frontière. Sujet : Master II : SIAD

Analyse des Performances et Modélisation d un Serveur Web

GENESIS - Generalized System for Imputation Simulations (Système généralisé pour simuler l imputation)

Dirigeant de SAS : Laisser le choix du statut social

Exercices d Électrocinétique

I. Présentation générale des méthodes d estimation des projets de type «unité industrielle»

Contrats prévoyance des TNS : Clarifier les règles pour sécuriser les prestations

TABLE DES MATIERES CONTROLE D INTEGRITE AU SEIN DE LA RECHERCHE LOCALE DE LA POLICE LOCALE DE BRUXELLES-CAPITALE/IXELLES (DEUXIEME DISTRICT) 1

Fiche n 7 : Vérification du débit et de la vitesse par la méthode de traçage

Pour plus d'informations, veuillez nous contacter au ou à

Assurance maladie et aléa de moralité ex-ante : L incidence de l hétérogénéité de la perte sanitaire

LE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régime») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF

Q x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2

Système solaire combiné Estimation des besoins énergétiques

Pro2030 GUIDE D UTILISATION. Français

Prise en compte des politiques de transport dans le choix des fournisseurs

Le Prêt Efficience Fioul

CATALOGUE EXCLUSIF TOUCH MEDIA CATALOGUE DE SITES FORMATS GLOSSAIRE. Notre sélection de supports en représentation exclusive au Maroc

COMPARAISON DE MÉTHODES POUR LA CORRECTION

CHAPITRE 14 : RAISONNEMENT DES SYSTÈMES DE COMMANDE

L enseignement virtuel dans une économie émergente : perception des étudiants et perspectives d avenir

Calculer le coût amorti d une obligation sur chaque exercice et présenter les écritures dans les comptes individuels de la société Plumeria.

LICENCE DE SCIENCES PHYSIQUES UV 3LSPH50. Année MODÉLISATION. Recherche des paramètres d'une représentation analytique J.P.

MÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES

Guide d installation. Système d alarme bidirectionnel sans-fil. Modèles:

TD 1. Statistiques à une variable.

UNIVERSITÉ DU QUÉBEC À MONTRÉAL L ASSURANCE AUTOMOBILE AU QUÉBEC : UNE PRIME SELON LE COÛT SOCIAL MARGINAL MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE

Table des Matières RÉSUMÉ ANALYTIQUE... 1 I. CONTEXTE La dette publique du Gouvernement Contexte institutionnel de gestion de la

CREATION DE VALEUR EN ASSURANCE NON VIE : COMMENT FRANCHIR UNE NOUVELLE ETAPE?

IT203 : Systèmes de gestion de bases de données. A. Zemmari zemmari@labri.fr

Calcul de tableaux d amortissement

master Objectif Université d Auvergne - Université Blaise Pascal Rentrée 2014 AUVERGNE

Chapitre 3 : Incertitudes CHAPITRE 3 INCERTITUDES. Lignes directrices 2006 du GIEC pour les inventaires nationaux de gaz à effet de serre 3.

Driss HARRIZI. MOTS CLES : contrôle de gestion - système d'éducation et de formation système d information - établissement public.

DES EFFETS PERVERS DU MORCELLEMENT DES STOCKS

22 environnement technico-professionnel

Ecole Polytechnique de Montréal C.P. 6079, succ. Centre-ville Montréal (QC), Canada H3C3A7

VIELLE Marc. CEA-IDEI Janvier La nomenclature retenue 3. 2 Vue d ensemble du modèle 4

Grandeur physique, chiffres significatifs

INTRODUCTION. Jean-Pierre MAGNAN Chef de la section des ouvrages en terre Département des sols et fondations Laboratoire central

Parlons. retraite. au service du «bien vieillir» L Assurance retraite. en chiffres* retraités payés pour un montant de 4,2 milliards d euros

GEA I Mathématiques nancières Poly. de révision. Lionel Darondeau

GUIDE D ÉLABORATION D UN PLAN D INTERVENTION POUR LE RENOUVELLEMENT DES CONDUITES D EAU POTABLE, D ÉGOUTS ET DES CHAUSSÉES

Corrections adiabatiques et nonadiabatiques dans les systèmes diatomiques par calculs ab-initio

La Quantification du Risque Opérationnel des Institutions Bancaires

Les prix quotidiens de clôture des échanges de quotas EUA et de crédits CER sont fournis par ICE Futures Europe

TRAVAUX PRATIQUES SPECTRO- COLORIMETRIE

The new Art of Smart. Loewe Art. La nouvelle intelligence télévisuelle.

THESE. Khalid LEKOUCH

Et pour vos clients, bénéficiez de services

Stéganographie Adaptative par Oracle (ASO)

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE. MEMOIRE Présentée à

- Acquisition de signaux en sismologie large bande. - Acquisition de signaux lents, magnétisme, MT.

Prêt de groupe et sanction sociale Group lending and social fine

Calculs des convertisseurs en l'electronique de Puissance

L ABC du traitement cognitivo-comportemental de l insomnie primaire

Précision de rigueur

STRATEGIE NATIONALE DES BANQUES CEREALIERES DU NIGER

IDEI Report # 18. Transport. December Elasticités de la demande de transport ferroviaire: définitions et mesures

Faire des régimes TNS les laboratoires de la protection sociale de demain appelle des évolutions à deux niveaux :

BUREAU D'APPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES

Guide du divertissement de voiture

Généralités sur les fonctions 1ES

1.0 Probabilité vs statistique Expérience aléatoire et espace échantillonnal Événement...2

Séparation de Sources par lissage cepstral des masques binaires

Comparative performance for isolated points detection operators: application on surface defects extraction

Avez-vous vous aperçu cette drôle de trogne? Entre nature et histoire autour de Mondoubleau

Corrigé du problème de Mathématiques générales Partie I

Une analyse économique et expérimentale de la fraude à l assurance et de l audit

Performances de la classification par les Séparateurs à Vaste Marge (SVM): application au diagnostic vibratoire automatisé

1. Les enjeux de la prévision du risque de défaut de paiement

Transcription:

Système d'ade à la Concepton de Bases de Données en Langage Naturel(*) O. Noual Laboratore de Recherche et Développement en Informatque, CE.R.I.S.T. E-mal : Noual@st.cerst.dz Abstract Ths paper présent a database desgn System n natural language.the man features of the System s : a natural language nterface and expert System. Wth nterface, a user may specfy databases n natural language.the expert System converse wth the user,detecte ncoherence,make a complète database conceptual scheme and fnally provde a relatonnel scheme. Introducton L a complexté et la talle sans cesse crossantes des applcatons bases de données(b.d) nécesstent le développement de méthodes systématques facltant la concepton de ces bases en assstant leurs concepteurs. Certanes partes du processus de concepton ont pu être formalsées à l'ade d'algorthmes: dans ce cas s l'algorthme est complexe, des programmes qu l'automatsent sont développés pour alléger le traval des concepteurs. D'autres partes du processus sont de nature purement heurstque. On ne peut alors rasonnablement qu'assster le concepteur dans sa tâche, en l'adant à défnr ses objectfs (en partculer, les étapes ou modèles défns par la méthode) en lu fournssant des formalsmes adaptés à son problème, en (*) Communcaton fate lors du Deuxème Symposum Internatonsl sur la Programmaton et les Systèmes/ ENSAG, Alger, 10-12 avrl 1995. lu suggérant des règles ou des ndcatons, et enfn, en lu offrant des programmes de concepton assstée par ordnateur (CAO)[BOU 85]. Pour ne pas astrendre l'utlsateur à l'apprentssage d'un langage technque, le processus de concepton serat grandement smplfé par une spécfcaton en L.N. des besons en données d'une applcaton. Cependant, une dffculté concerne la grande varété de styles de phrases que supporte un L.N. Il apparaît que l'on dot autorser seulement les styles qu condusent à une modélsaton drecte (et, de préférence, unque) des besons d'une applcaton[bat 92]. La nature de la tâche de concepton exge la mse en œuvre de deux types de connassances (connassances sur le(s) modèle(s) conceptuels et connassances expérmentales). La constructon d'un outl qu reproduse l'atttude de l'expert et qu explote une connassance expérmentale, ndspensable à la maîtrse de la concepton en la combnant à une connassance plus formelle, peut apporter une ade "réelle" dans le processus de concepton. RIST- VOL. 5 N l, 1995 23

Le système a été construt dans le but de répondre aux objectfs suvants : (1) Faclter l'nteracton avec l'utlsateur en lu offrant une nterface convvale auss rche que facle à utlser Cette nterface dot notamment lu permettre de capturer et d'exprmer toute la sémantque de son applcaton. (2) Construre des bases de connassances regroupant des acqus théorques sur les modèles tels que le modèle Entté/Assocaton(E/A) et le modèle relatonnel. (3) Identfer pour chaque phase de concepton les mécansmes de rasonnement généraux ou spécfques, emprques ou algorthmques. (4) Construre un système d'outls ouvert capable d'acquérr de nouveaux concepts théorques et de nouvelles règles de concepton. Dans cet artcle, nous nous proposons tout d'abord de donner le fonctonnement général et l'archtecture du système. Nous décrvons ensute l'nterface en L.N. et la méthodologe de concepton de bases de données. Nous termnerons par un exemple de sesson. 1. Fonctonnement général du système Le système d'ade à la concepton de B.D. en L.N. est composé d'une nterface en L.N., d'un traducteur et d'un S.E. L'nterface analyse la spécfcaton énoncée par l'utlsateur; pus produt une représentaton nterne du sens de cette dernère. Le traducteur transforme la représentaton nterne produte en une base de fats représentant le schéma conceptuel modélsant les données. 24 Cette base de fats est ensute nterprétée par un système expert que nous avons spécalsé dans la concepton de B.D. Premèrement, le système expert vérfe la cohérence (absence de contradctons et de redondances) et la complétude (présence de toutes les nformatons nécessares) de la base de fats consdérée. En cas d'échec (présence de contradctons ou absence d'nformatons nécessares à la poursute du processus. de concepton), le concepteur est nvté à corrger sa spécfcaton en foncton des dagnostcs qu lu sont fourns. Le processus de concepton est en effet un cycle d'acquston/valdaton [MET 93] qu ne s'arrête que lorsque la spécfcaton est jugée correcte par le système expert. Deuxèment, le schéma conceptuel, valdé et complété est tradut en un schéma logque relatonnel. Ce schéma est produt ndépendamment du S.G.B.D. qu sera effectvement utlsé par la sute pour créer la base de données. La nouvelle base de fats produte (contenant le schéma relatonnel) sera tradute en une spécfcaton textuelle codée dans un langage de descrpton de données (L.D.D. e.g. SQL) correspondant au SGBD utlsé pour créer la B.D. conçue. 2. Archtecture du système (vor schéma page suvante) 3. l'nterface en langage naturel L'nterface en L.N. représente le nveau lngustque du système : Elle est destnée à faclter la tâche du nveau conceptuel pour modélser une B.D. Pour des rasons de modularté et d'effcacté, elle est dvsée en deux modules : - un analyseur "Morpho-lexcal" - un analyseur "Syntaxco-sémantque". RIST- VOL. 5N 1, 1995

Sase langage I naturel texte (spécfcaton externe ) dut (mots* concepts (Lexque îenuntujue (fan domane dappbcat»n chos) ANALYSEUR DU LANGAGE NATUREL erreurs dagnostc: (représentaton nterne en graphes conceptuels de Sowa) traducteur (Passage Graphes concept ' de SOWA > schéma conceptuel E/A) BF (schéma conceptuel verson non valdée) I cohérence + BRI complétude j vahdato erreurs dagnostc! BR2 (passage schéma conceptuel» schéma relatonnel) GENERATEUR DE SYSTEMES EXPERTS (CERESY) schéma conceptuel schéma relatonnel BR3 LDD "X (règks pour LDD du SGBD "X") u schéma physque (Spécfcaton du schéma physque relatonnel dans le LDD du SGBD "X"). '_ (schéma conceptuel verson valdée) BF 2 BF 3 (schéma relatonnel ndépendant de tout SGBD) RIST-VOL.5N l,1995 25

3.1. L'analyseur morpho-lexcal [NOU 91], [AZO 94] L'analyseur "morpho-lexcal" reçot en entrée une phrase écrte en langage naturel, la découpe en enttés lexcales et resttue en sorte la ou les défntons de chacune d'elles. Un lexque est consttué d'un noyau de base qu est augmenté, pour chaque applcaton, des mots spécfques à cette dernère. Ce noyau regroupe les mots-outls(artcles, prépostons, pronoms,...) et les mots propres à la concepton de bases de données(e.g. verbes exprmant des dépendances fonctonnelles, des généralsatons,...). La méthode consste à ne stocker dans le dctonnare que les formes canonques (sngulers lorsqu'ls exstent, bases des verbes,...), ce qu rédut consdérablement le volume du dctonnare. En contre-parte, ' elle nécesste des mécansmes d'analyse permettant de passer d'une forme fléche à une forme canonque et des mécansmes de recherche pour accélérer les accès. 3.2. L'analyseur syntaxcosémantque[nou 91], [AZO 94] L'analyseur "syntaxco-sémantque" reçot en entrée une lste de mots dotés de leurs défntons et resttue en sorte le sens de la phrase. L'étude des dfférents outls exstants nous a menés à opter pour l'utlsaton des grammares ATN(Augmented Transacton Network) sémantques pour la réalsaton de l'analyseur syntaxco-sémantque. Elles permettent de mettre en relef l'nterdépendance de la syntaxe et de la sémantque en permettant une analyse drgée par la syntaxe tout en construsant, au fur et à mesure de l'analyse, des partes de représentaton nterne du sens grâce aux actons attachées aux arcs de la grammare. En fasant le bon chox des structures syntaxques à représenter par les graphes de la grammare et le jeu des condtons sélectonnant les chemns à emprunter, l'analyse peut être très effcace étant donné que le nombre de concepts est relatvement rédut. La grammare ATN se compose d'un ensemble de graphes mplémentés sur une structure de données dynamque qu permet faclement de l'enrchr. Le parcours de ces graphes, pour extrare le sens de la phrase, est réalsé par un nterpréteur ATN. Pour des rasons de flexblté et de portablté, l a été conçu de manère à ce qu'l sot général et ndépendant de tout domane. Pour consdérer un domane partculer, l suffra de dsposer du dctonnare et de la grammare ATN correspondants. La seule contrante à respecter étant le codage de la grammare. 3.3. Représentaton de sens En nformatque, comprendre une phrase écrte en langage naturel consste à transformer celle-c en une représentaton nterne manpulable par programme. Il s'agt donc c de trouver une structure de données permettant de représenter le sens d'une phrase. Les graphes conceptuels sont un modèle adéquat pour la représentaton nterne du sens de fats exprmés en langage naturel [MET 93], [MOU 92]. Chaque élément de connassance est représenté par un graphe fn, bpart, orenté comportant deux types de noeuds : des concepts et des relatons lant des concepts. Dans un graphe, les noeuds "concept" représentant des enttés, des attrbuts, des états, et des événements; et les noeuds "relaton" montrent comment les concepts sont nterconnectés [FAR 89]. 26 RIST-VOL.5N l,1995

Les graphes conceptuels sont auss un outl d'analyse sémantque grâce à des prmtves de manpulaton de graphes, prncpalement l'apparement et la jonture des graphes conceptuels [CHE 92]. L'analyseur détermne le sens de la phrase en réunssant les graphes conceptuels de tous les éléments de la phrase, en s'adant de la structure syntaxque de la phrase. Il utlse comme support de base un lexque sémantque contenant les graphes canonques nécessares pour coder le sens des mots. Pour chaque mot de la phrase, le programme chost un graphe conceptuel parm les dfférentes alternatves possbles : l examne un sommet de l'arbre syntaxque (pouvant être mplcte) couvrant pluseurs mots et effectue l'opératon d'apparement des graphes. Cette opératon échoue quand l exste une ncompatblté entre certans concepts ntervenant dans les graphes des deux mots que l'on tente d'assocer; dans un tel cas, le programme cherche d'autres graphes conceptuels correspondant à d'autres sgnfcatons possbles des mots ncompatbles, et l tente à nouveau l'apparement. Fnalement, l'analyse produt un graphe conceptuel représentant la sgnfcaton du groupe de mots stué sous le sommet consdéré de l'arbre syntaxque. De proche en proche, et en remontant vers le sommet de l'arbre syntaxque, le programme construt un graphe conceptuel représentant la sgnfcaton de la phrase. L'analyse sémantque utlsée par notre système est drgée par la syntaxe grâce à une grammare ATN [AZO 94]. Le codage du lexque sémantque est une tâche dffcle, et la qualté de ce codage condtonne le résultat global du projet d'analyse sémantque. 4. Méthodologe de concepton de bases de données [AZO 94] Le processus de concepton est long et complexe. Il débute par l'analyse des besons d'un utlsateur en données et aboutt à un schéma physque relatonnel. Il est alors nécessare de suvre une méthodologe rgoureuse permettant d'appréhender les dfférents aspects de ce processus de concepton. La méthodologe de concepton de bases de données adoptée est basée, au nveau conceptuel, sur un modèle enttéassocaton étendu. En effet, l est souvent utlsé comme outl de communcaton entre un concepteur et un utlsateur de la base de données, grâce à sa faclté d'utlsaton et de représentaton des concepts [STO 91]. 4.1. Le modèle Entté-Assocaton étendu Les prncpaux concepts de ce modèle sont les concepts d'entté et d'assocaton entre les enttés (chacune jouant un rôle partculer). Les enttés et les assocatons peuvent être caractérsées par des attrbuts représentant des proprétés sgnfcatves. Les lens entre entté et assocaton sont caractérsés par un couple : cardnalte mnmale et cardnalte maxmale. Toute entté dot être dentfée de façon unque par un ou pluseurs de ses attrbuts et/ou d'autres enttés. Des dépendances fonctonnelles exstent entre des attrbuts. Les hérarches de généralsaton permettent d'avor des schémas conceptuels plus concs et une sémantque plus précse grâce au mécansme d'hértage. 4.2. Descrpton de la méthodologe de concepton La méthodologe de concepton consste RIST- VOL. 5N 1, 1995 27

Schéma non valdé Incohérences Schéma cohérent Redondances Schéma mnmal Base «valdaton» Complétude Schéma complet Traducton Schéma relatonnel Normalsaton Base «conceptuel-relatonnel» Schéma relatonnel normalsé Génératon Spéc. / LDD Base «texte» Spécfcaton en LDD Fgure 1 : Méthodologe de concepton adoptée en des règles d'nference (sous forme de règles de producton) destnées à être nterprétées par un générateur de systèmes experts. Ces règles sont répartes sur pluseurs bases de règles: «valdaton», «conceptuel-relatonnel» et «texte» (fgure 1 ). Deux types de règles sont dstngués : des méta-règles (règles fxant l'applcaton éventuelle et l'ordre d'applcaton d'autres règles) qu plotent, de façon globale, le processus de concepton par enchaînement des dfférentes étapes, - des règles qu concourent à la réalsaton de tâches partculères. L'utlsaton de méta-règles offre l'avantage d'ajouter faclement de nouvelles étapes au processus de concepton au fur et à mesure que la stratége est raffnée ( par l'ajout de règles suggérées par des experts). La base "valdaton" consste à vérfer : - La cohérence : *détecter et sgnaler les ncohérences du schéma conceptuel ntal correspondant 28 RIST- VOL. 5N 1, 1995

' à la spécfcaton fourne par l'utlsateur. * détecter les redondances et. le cas échéant, rendre le schéma conceptuel mnmal, - La complétude détecter les nformatons manquantes et rendre le schéma conceptuel complet conformément au modèle conceptuel chos, - Générer et affcher le schéma conceptuel obtenu pour être valdé par le concepteur qu vérfe la conformté du schéma avec sa spécfcaton. La base "conceptuel-relatonnel" consste à : - chosr un dentfant pour chaque entté parm ses canddats possbles suvant certans crtères, - tradure le schéma conceptuel en un schéma relatonnel avec les contrantes d'ntéqrté nécessares, - normalser les relatons obtenues à létape précédente pour obtenr un schéma relatonnel normalsé (dans notre cas, nous nous lmtons à la trosème forme normale), - affcher le schéma relatonnel obtenu. sb sm îneq - La base "texte" consste à générer la spécfcaton du schéma relatonnel obtenu dans un langage de descrpton de données correspondant à un SGBD partculer. 5. Exemple d'une sesson de traval L'exemple décrt c-dessous concerne la geston de bblothèques. Spécfcaton en L.N. Un lvre et un artcle sont une sorte d'ouvrages. Un lecteur peut emprunter un ou pluseurs ouvrages pour une certane pérode. Les ouvrages sont décrts par un résumé et des mots-clés. Un lvre est dentfé par un ISBN et un numéro d'édton Représentaton en graphes conceptuels L1VRE (s a) ^ OUVRAGE IARTICLEI ft (sa)»- OUVRAGE EMPRUNTER! - (agnt) f, LECTEUR: ((),-)] -(ob )»- OUVRAGE:(l,N)] -(dur) * [PÉRIODE: (1.1)] RKSI'MK Xattr) > (HTRAOE Xaltr) > MOT-CI-K] IIJVRK] V (dcnt) ISBN xamp) > I >(comp) j \rm;ro-kdnïo\) Schéma conceptuel E/A (base de fats) (GEN LIVRE OUVRAGE) (ENTITE OUVRAGE) (ENTITE LIVRE) (GEN ARTICLE OUVRAGE) (ENTITE ARTICLE) (AS SOC 1 EMPRUNTER) (E-R 1 LECTEUR AGNT 0 N) (E-R 1 OUVRAGE OBJ 0 1) (ATT-ASS 1 PERIODE I 1) (ENTITE LECTEUR) (ATT-ENT RESUME OUVRAGE 1 1) (ATT-ENT MOT-CLE OUVRAGE 1 N) (ID-ATT 1 LIVRE ISBN) (ID-ATT 1 LIVRE NUMERO-EDITION) (ID-ATT 2 OUVRAGE COTE) 9QSÇn6l Schéma relatonnel (base de fats)... (REL LECTEUR) (KEY LECTEUR NUMERO-LECTEUR) (REL OUVRAGE) (KEY OUVRAGE COTE) (REL EMPRUNTER) (KEY EMPRUNTER COTE) (FORE.IGN EMPRUNTER LECTEUR) (ATT EMPRUNTER PERIODE 1 1) RIST-VOLSN l,1995 29

Spécfcaton en SQL CREATE TABLE EMPRUNTER! COTENUMBER(5). NUMERO-LECTEUR NUMBER (4). PERIODE DATE NOT NUEE UNIQUE. PRIMARY K.EY (COTE) CONSTRAINT INCLOUVRAGE. FORE1GN K.EY (NUMERO-LECTEUR) REFERENCES LECTEUR (NUMERO- LECTEUR) Concluson Le Système d'ade à la concepton de bases de données en langage naturel réalsé nous a perms de montrer l'ntérêt et la fasablté de l'approche système expert. Il nous a également montré quelques problèmes mportants dans la constructon d'une nterface en langage naturel (l'énumératon des connassances nécessares à la compréhenson, les théores formelles qu permettent de les représenter et les mécansmes nformatques pour les utlser) et dans la formalsaton de la connassance experte et sa traducton en prédcats et en règles de producton. Le système se compose de deux partes prncpales : une nterface analysant des spécfcatons en langage naturel énoncées par l'utlsateur modélsant une base de données, - un système expert plotant le processus de concepton. La lason entre ces deux partes est assurée par un traducteur qu s'occupe de tradure une représentaton nterne du sens des phrases fournes en prédcats nterprétables par le système expert. Le formalsme de représentaton nterne du sens est le modèle des graphes conceptuels de Sowa [SOW 86]. La pussance d'expresson sémantque de ce modèle permet d'appréhender tous les aspects utles à la modélsaton conceptuelle d'une base de données. La Méthodologe de concepton est basée sur un modèle E/A étendu. Elle est subdvsée en pluseurs classes, entre autres celle relatve au tratement de la cohérence et la complétude d'une spécfcaton donnée par un utlsateur. Elle est faclement extensble au fur et à mesure que la méthodologe évolue et est raffnée par l'ntroducton de règles suggérées par des experts. Le système expert utlsé a pour formalsme de représentaton de la connassance les prédcats et les règles de producton. Ce formalsme est connu pour être pussant au nveau de la déducton mas pauvre en sémantque. C'est ce derner pont qu rend dffcle la formalsaton de la connassance experte et sa traducton. Un certan nombre d'extensons est envsagé au système : - penser à remplasser le formalsme de prédcat par un formalsme tel les réseaux sémantques, - augmenter les connassances qu'l manpule en quantté et en qualté. Par exemple, permettre plus de constructons syntaxques au nveau de la syntaxe et plus de concepts au nveau sémantque, - augmenter sa tolérance aux erreurs, et sa flexblté, - concevor d'autres types d'nterfaces, par exemple une nterface graphque et une nterface tratant un langage de spécfcaton qu vendraent s'ajouter à l'nterface langage naturel, 30 RIST- VOL. 5 N l, 1995

- de pouvor supporter une phase de reverse engneerng permettant de passer d'un schéma relatonnel à un schéma conceptuel (dans un certan modèle, en partculer l'e/a). Références : [ALI 91] Z. Almazgh, " Evoluton des méthodes de développement d'applcaton bases de données ", 1 er sémnare sur les bases de données, Alger, Jun 1991. [AZO 94] A. Azouaou, M.T. Djema, " Système d'ade à la concepton de bases de données en langage naturel ", thèse d'ngénorat, U. S. T. H. B, 1994. [BAT 92] C. Batn, S. Cer, SB. Navathe, " Conceptual database desgn. An Enttyrelatonshp approach Benjamn/Cummngs, 1992. [BOU 85] M. Bouzeghoub, " Une base de connassances pour un système expert en concepton de bases de données ", actes des journées d'étude (Djon 1985), collecton MBD. [CAP 80] J. & J. P. Caput, " Dctonnare des verbes franças ", Larousse, 1980. [CAU 88] C. Cauvet, " Un modèle et un outl d'ade à la concepton des systèmes d'nformaton ", Thèse de doctorat, Pars 6, 1988. [CER 93] " CERESY. Manuel de l'utlsateur", CERIST.1993. [CHE 92]. M. Chen, M.-L Mugner, " Conceptual graphs : fundamental notons ", Intellgence Artfcelle, Vol. 6, N. 4, 1992. [CLE 85] E K Clemons, " Data models and the ANSI/SPARC archtecture ". n [YAO 85] [DIV 92] M Dvne, " Parlez-vous Merse?", 4 eme éd., Eyrolles, 1992. [FAR 89] J. Fargues, " Des graphes pour coder le sens des phrases ", Pour la scence, N. 137, 1989. [LEV 91] G. Levreau, J.-N. Meuner, M. Bouzeghoub, E. Métas, "Défnton d'une nterface langage naturel pour la concepton de bases de données", Rapport technque MASI, 1991. [MET 93] E. Métas, J.-N. Meuner, G. Levreau, " Database schéma desgn, valdaton and vew ntégraton : a perspectve from natural language ", Rapport MASI - Pars VI, 1993. [MOU 92] B. Mouln, P. Creasy, " Extendng the conceptual graph approach for data conceptual modelng ", Data & Knowledge Engneerng, Vol. 8, 1992. [NOU 91] 0. Noual, "Concepton et réalsaton d'un système de compréhenson de phrases nterrogatves et de génératon automatque de réponses en langage naturel (SIGAR)", Thèse de Magster, CDTA, CERIST, 1991. [OBR 88] D. Obretenov, Zh. Angelov, J. Mhaylov, P. Dshleva, N. Krova, " A knowledge-based approach to relatonal database desgn ", Data & Knowledge engrg., vol.3 (1988), pp. 173-180. [REI 92] D. Rener, " Database desgn tools ", n [BAT 92]. [SAB 89] G. Sabah, "L'ntellgence artfcelle et le langage. Vol.1, processus de compréhenson", 2ème édton, RIST- VOL. 5 N 1,1995 31

: ' Hermès. 1989 [SAB 90] G Sabah. "L'ntellgence artfcelle et le langage Vol.2, représentaton des connassances". Hermès, 1990 [SOW 86] J F. Sowa, E C Way, "Implementng a semantc nterpréter usng conceptuel graphs ". IBM J Res. Develop. vol 30, n 1, January 1986. [STO 91] V C Storey, " Relatonal database desgn based on the enttyrelatonshp model ", Data & Knowledge engrg.. Vol 7, 1991 [YAO 85] SB Yao (éd.), " Prncples of database desgn, Vol. 1 Logcal organzatons ", Prentce-Hall, 1985.... mœmmmmmmmm! t :.' I A n, sm I" 32 ^^ RIST- VOL 5N 1, 1995