Auteurs : Martine de Calmès, Guy Pérennou Date : Octobre 2001 Version : 1.1 Octobre 2001
Guy Pérennou, Martine de Calmès : Codes BDLex- MHATLex Octobre 2001 II
Codes BDLex-MHATLex "!#$&%('*)+! Octobre 2001 III
Guy Pérennou, Martine de Calmès : Codes BDLex- MHATLex,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, TABLE DES MATIERES Codes BDLex-MHATlex...1 1 Introduction...1 2 Structure des entrées lexicales...1 3 Codes graphiques BDLex-MHATLex...3 4 Code phonétique BDLex-MHATLex...4 4.1 Généralités... 4 4.2 Voyelles et semi-voyelles... 4 4.3 Les voyelles à double timbre... 5 4.4 Consonnes... 6 5 Influence régressive...7 5.1 Influences régressives dans MHATLexPho... 7 5.2 Influences régressives dans MHATLexPhy - Modèle simplifié... 7 6 Codes syntaxiques...8 6.1 Parties du discours (champ CS)... 8 6.2 Variables syntaxiques... 8 6.2.1 Genre et nombre (champs 5)... 8 6.2.2 Personne (champ 5)... 8 6.2.3 Temps et modes (champ 6)... 8 6.3 Sous-catégories syntaxiques (champ 6)... 9 6.3.1 Codes des sous-catégories de déterminants... 9 6.3.2 Code des sous-catégories de pronoms... 9 6.3.3 Code des sous-catégories de conjonctions... 9 6.3.4 Codes des sous-catégories d'adverbe et de certaines prépositions... 9 ----------------------------------------------------------------. /. 0. 1 2340 Octobre 2001 IV
Codes BDLex-MHATlex Guy Pérennou, Martine de Calmès (perennou, decalmes)@irit.fr IRIT, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse Cedex 1 Introduction Voici les structures et les codes des lexiques figurant dans les matériaux BDLex-MHATLex. 2 Structure des entrées lexicales BDLex GRAPHIE;PHONO;FPH;CS;Champ5;Champ6;LIEN;ILEX MhatLexPMS GRAPHIE;PHONO;CS;Champ5;Champ6;LIEN; ILEX MHATLexPho GRAPHIE;INFLR ;PHONO;INFLP;CS MHATLexPhy GRAPHIE;CTXG ;PHONO;CTXD ;CS MHATLexStd GRAPHIE;PHONO;CS;Champ5;Champ6;LIEN;ILEX 5 6 5 7 5 8 9:;7 Octobre 2001
E F G H I J K L M N O P Guy Pérennou, Martine de Calmès : Codes BDLex- MHATLex <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< 1) GRAPHIE Graphie du mot 2) INFLR Influence régressive exercée par le mot. 3) PHONO Représentation phonologique du mot. 4) INFLP Influence progressive exercée par le mot. 5) FPH Il précise le comportement de la finale phonologique. 6) CTXG Il donne le contexte phonologique gauche requis pour le mot phonotypique. 7) CTXD Il donne le contexte phonologique droit requis pour le mot phonotypique. 8) CS Classe syntaxique du mot. 9) Champs (ou attributs) 5 et 6 Si CS = N (nom) ou J, F, G, M (adjectifs) ou K (participe passé) champ 5= genre + nombre champ 6 = () /* () représente la chaîne vide */ si CS = V (verbe) champ 5 = personne + nombre champ 6 = temps + mode si CS = d (déterminant) champ 5 = personne + nombre (+personne + nombre) champ 6 = sous-catégorie(s) si CS = P (pronom) champ 5 = personne + nombre (+ personne) champ 6 = sous-catégorie(s) si CS = c (conjonction) ou A (adverbe) champ 5 = () champ 6 = sous-catégorie(s) si CS = p (préposition), i (interjection) champ 5 = () champ 6 = (sous-catégorie(s)) 10) LIEN Ce champ relie un mot fléchi au mot canonique dont il dérive. ================================================================ >? > @ > A BCD@ Octobre 2001 2
Y Z Codes BDLex-MHATLex QQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQ 11) ILEX pour un mot canonique LIEN prend la valeur = sinon LIEN prend la valeur GRAPHIE du mot canonique dont il dérive. ILEX = 'L23' pour les mots fléchis dérivant des 23000 mots canoniques de BDLex 23000 (les 23000 mots les plus fréquents). = () sinon 3 Codes graphiques BDLex-MHATLex MHATlex et BDLex ont le même code graphique : les symboles usuels excepté 'espace' (dans les mots composés) et les caractères avec diacritiques précisés dans la table 1. Diacritiques standards Codes BDLex- MATHLex Table 1 - Diacritiques graphiques. Lettres avec diacritiques: ISO latin / MHATlex- BDLex Exemples: ISO latin / MHATlex-BDLex 'blanc' _ ' ' / _ pomme de terre / pomme_de_terre accent aigu 1 é/e1 beauté ; céder / beaute1 ; ce1der accent grave 2 à/a2 ; è/e2 ; ù/u2 à ; mère ; accès ; où / a2 ; me2re ; acce2s ; ou2 accent circonflexe 3 â/a3 ; ê/e3 ; î/i3 ; ô/o3 ; û/u3 âge ; même ; maître ; vôtre ; fît / a3ge me3me mai3tre vo3tre fi3t tréma 4 ä/a4 ; ë/e4 ; ï/i4 ; ü/u4 Noël ; haïr / noe4l hai4r cédille 5 ç/c5 leçon / lec5on Les matériaux BDLex-MHATLex peuvent utiliser l'iso latin ou le code MHATlex-BDLex. Ce denier a l'avantage d'être compatible avec tous les types de clavier. RS R"T#RU&V(W*X+T Octobre 2001 3
d e f g Guy Pérennou, Martine de Calmès : Codes BDLex- MHATLex [[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[ 4 Code phonétique BDLex-MHATLex 4.1 Généralités Les codes BDLex-MHATLex sont basés sur le code SAMPA, excepté : le 'e' élidable, ou schwa transcrit /@/ le 'h' disjonctif transcrit /*/ il interdit la liaison, par exemple "héros" /*ero/, la voyelle neutre et centrale /6/ elle peut apparaître en syllabe ouverte comme dans "dehors" /d6or/, "vendredi" /va~dr6di/ de plus les transcriptions de MHATLex peuvent comporter des unités complexes : les GPC et les GPM. 4.2 Voyelles et semi-voyelles La table 2 donne les codes de BDLex et MHATLex pour les voyelles et semi-voyelles. Le code API correspondant est mis entre parenthèses. Code phonétique (+API) Exemples Représent. Graphie phonétique j (j) lj2 lieu w (w) Rwa roi H (h i lhi lui i (i) fil fil y (y) syk suc u (u) fu fou Table 2 - Voyelles et semi-voyelles Commentaires e (e) kle cle 'E' semi-fermé 2 (jlk f2 feu 'OE' semi-fermé o (o) bo beau 'O' semi-fermé E/ se/zir saisir prononciation variable entre [e] et [E] 6 (m ) seulement en syllabe ouverte d6or dehors voyelle neutre en syllabe ouverte non accentuée @ R@kOR record [R6kOR] or [RkOR] ou : [R(6)kOR] : le schwa @ est un [6] optionnel O/ fo/nem@ phonème prononciation variable entre [o] et [O] E ZEl gel 'E' semi-ouvert en syllabe fermée O mor mort 'O' semi-ouvert en syllabe fermée 9 (npo l9r leur 'OE' semi-ouvert en syllabe fermée a (a) pat@ patte pâte e~ (q"r ve~ vin 'E' nasal 9~ (spt parf9~ parfum 'OE' nasal a~ (u v ba~ banc 'A' nasal o~ (wyx do~ don 'O' nasal accentuée toutes variantes de 'A' Semi-voyelles U Voyelles fermées Voyelles moyennes Voyelles ouvertes Voyelles orales Voyelles nasales Vn Remarque : Dans BDLex et MHATLex le schwa /@/ est un [6] optionnel. Quand il est prononcé, il est voisin du schwa de l'api. Une unité non optionnelle ne peut être transcrite /@/ dans nos conventions, par ex : "venir" /v@nir/ z [v(6)nir] (c'est-à-dire : [vnir] ou [v6nir] ) "pesa" /p6za/ { [p6za] "samedi" /sam@di/ [sam(6)di] (c'est-à-dire [samdi] or [sam6di] ) "vendredi" /va~dr6di/ } [va~dr6di] \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\ ] ^ ] _ ] ` abc_ Octobre 2001 4
ˆ Š Œ Ž Codes BDLex-MHATLex ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 4.3 Les voyelles à double timbre Les voyelles à deux timbres (selon la dénomination classique) sont les regroupements de voyelles moyennes d'une part ("E", "OE", "O") et celui des deux 'a' d'autre part ("A"). Transcriptions de BDLex-v2 relatives à ces voyelles : 1. Série du E en syllabe fermée : E, par ex: /mer/ "mer", /festif/ "festif" en syllabe ouverte non accentuée : E/, par ex: /*E/Ro/ "héros"; me/zo~ "maison" en syllabe ouverte accentuée : e ou E/ selon les prononciations généralement attestées et jugées correctes, par ex : /kafe/ "café", /SalE/ /"chalet". 2. Série du O En syllabe ouverte accentuée : o, par ex: /gato/ "gâteau" en syllabe fermée accentuée : O, O/ ou o, par ex: /bros@/ "brosse", /Roz@/ "rose", /pilon@/"pylône", /sol@/ "saule" ou "sole", /sol/ "sol", /fort@/"forte", /te/le/fo/n@/ "téléphone" en syllabe non accentuée : O/, par ex: /po/li/ "poli", /O/tO/matik@/ "automatique", /fo/rt6ma~/ "fortement" Remarque - On trouve toujours le timbre /o/ dans les syllabes ouvertes accentuées, et aussi quelquefois dans les syllabes fermées (c'est toujours le cas si la syllabe est fermée par /z/). 3. Série du OE en syllabe ouverte accentuée : 2, par ex: /f2/ "feu", /a~z2/ "enjeu" en syllabe fermée accentuée : en général 9 mais 2 est également possible, par ex: /k9r/"cœur", /klam9r/"clameur", /maz9r@/"majeure", /m9rtr@)/ "meurtre", /fril2z@/ "frileuse" en syllabe non accentuée interne avec possibilité d'élision : @, par ex: /sam@di/ "samedi" en syllabe non accentuée interne sans possibilité d'élision : 6, par ex: /va~dr6di/ "vendredi" en syllabe finale non accentuée : elles comportent toujours @, par ex: /m9rtr@)/ "meurtre". 4. Interprétation de /a/ Les variantes de a (/a/ d avant et / d'arrière) n'ont pas été différenciées. Il s'avère en effet que les locuteurs les emploient de manière imprévisible (par exemple "âme" prononcé [ m] ou, plus généralement, [am] ) Remarque - Les locuteurs sont plus ou moins sensibles à l'orthographe (par exemple les graphies en "ai" tendent à la prononciation [E], tandis que la graphie "é" tend à la prononciation [e] ) et à l'harmonie vocalique qui peut contrebalancer la graphie ( céder vs cédant, le premier avec [e], le deuxième avec tendance vers [E]. Les deux sont transcrits avec E/ dans BDLex c'est-à-dire "céder"/se/de/ vs "cédant"/se/da~/ La prononciation des voyelles à double timbre est variable en syllabe inaccentuée, surtout en syllabe ouverte. C'est la raison pour laquelle nous adoptons généralement le timbre neutre dans ce cas. Cependant nous transcrivons toujours /E/ en syllabe fermée, et parfois /9/ ou /O/ (en syllabe fermée par /R/ ou /l/) au lieu de leurs variantes neutres. Différents aspects se rapportant aux questions précédentes sont abordés dans les références suivantes : A. Lerond, Dictionnaire de la prononciation, Larousse (1980) P. Fouché, Traité de prononciation française, Paris, Klincksiek, 2e éd. (1959) A. Martinet, Henriette Walter, Dictionnaire de la prononciation française dans son usage réel, France- Expansion (1973). " # &ƒ( * + Octobre 2001 5
Guy Pérennou, Martine de Calmès : Codes BDLex- MHATLex 4.4 Consonnes La table 3 donne les codes BDLex-MHATLex pour les consonnes. Remarque : L'unité /*/ est vide au plan phonétique. Elle ne se manifeste que par l'interdiction de la liaison. Phono. code (+IPA) Table 3 - Consonnes Exemple Représentation Graphie phonologique p par part t tir tir k ku cou b bal bal d da~ dent g gar gare f fa fa s sa sa S (ž ) Su chou v val val z zon @ zone Z (Ÿ ) ZuR jour m kom @ comme n kan @ canne J ( ) dij @ digne N ( ) ka~pin camping Commentaires Plosives sourdes T Plosives voisées D Plosives: P=T + D Fricatives sourdes S Fricatives voisées Z Fricatives: F = S + Z Consonnes nasales N l kol col Liquides : L R kor cor * *ERo héros Interdit la liaison š œ Octobre 2001 6
Codes BDLex-MHATLex 5 Influence régressive C'est l'influence exercée sur le mot antécédent. Elle affecte : - la liaison, c'est-à-dire la prononciation des consonnes latentes ; on opposera ici les mots à début consonantique auxquels s'ajoute le "h" disjonctif /*/ qui s'oppose aux autres ; - l'assimilation de sonorité : on opposera ici les débuts avec obstruantes (obstruantes voisées B / obstruantes non voisées Q) aux autres ; en effet ces obstruantes tendent à imposer leur sonorité aux consonnes finales du mot antécédent ; - l'assimilation de nasalité : on opposera les mots commençant par consonne nasale N aux autres ; en effet une occlusive voisée finale peut se nasaliser dans ce contexte 5.1 Influences régressives dans MHATLexPho Les influences régressives prises en compte dans MHATLexPho sont données dans la table 4. La première colonne donne la structure hiérarchique des contraintes régressives. Table 4 - Influences régressives dans MHATLexPho Structure infl. rég. INFLR Exemple Initiale du mot * * "héros" 'h' disjonctif G *U *U "whisky" 'h' disjonctif suivi de semi-voyelle L L "radeau" Liquide +C -N O B B "joli" Obstruante voisée Q Q "fenêtre" Obstruante sourde +N +N "noire" Consonne nasale -C -C "ami" Voyelle ou semi-voyelle 5.2 Influences régressives dans MHATLexPhy - Modèle simplifié Dans les règles phonologiques du modèle simplifié on limite les catégories d'influence comme l'indique la table 5. Dans le lexique MHATLexPhy les champs CTXD et. CTXG contiennent les contraintes contextuelles des règles phonologiques en jeu. Table 5 - Influences régressives du modèle simplifié CTXD Exemples ±règles phpnologiques affectées * "héros" -liaison -élision de @ -assimil_nas +C "whisky" "radeau" -liaison -assimil_nas -N "joli" "fenêtre" +N "noire" -liaison +assimil_nas -C "ami" +liaison -assimil_nas " # & ( * + Octobre 2001 7
³ µ ¹ º» ¼ ½ ¾ À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ð Ñ Ò Ó Ô Guy Pérennou, Martine de Calmès : Codes BDLex- MHATLex ªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªªª 6 Codes syntaxiques 6.1 Parties du discours (champ CS) A c d F G J i K M N p P V adverbe conjonction déterminant adjectif ou nom féminin adjectif ou nom (masculin ou féminin) adjectif interjection verbe au participe passé adjectif ou nom masculin nom préposition pronom verbe 6.2 Variables syntaxiques 6.2.1 Genre et nombre (champs 5) Genre Nombre M masculin F féminin i invariable en genre 0 neutre S singulier P pluriel j invariable en nombre 0 neutre 6.2.2 Personne (champ 5) 1ère personne : 1 2ème personne : 2 3ème personne : 3 6.2.3 Temps et modes (champ 6) Temps p présent i imparfait a passé simple f futur Mode Ï i indicatif s subjonctif c conditionnel I impératif inf infinitif P participe ««««««««««««««««««««««««««««««««««««««««««««««««««««««««««««««««±² Octobre 2001 8
Ý Þ ß à á â ã ä å æ ç è é ê ë ì í î ï ð ñ ò ó ô õ ö ø ù ú û ü ý þ ÿ Codes BDLex-MHATLex ÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕÕ 6.3 Sous-catégories syntaxiques (champ 6) 6.3.1 Codes des sous-catégories de déterminants rc article défini contracté ex: au rd article défini ex : le ri article indéfini ex : un rp article partitif ex : du di adjectif indéfini ex : aucun dd adjectif démonstratif ex : ce, cet dp adjectif possessif ex : son de adjectif interrogatif/exclamatif ex : quel dc adjectif numéral cardinal ex : deux do adjectif numéral ordinal ex : deuxième 6.3.2 Code des sous-catégories de pronoms de pronom démonstratif ex : ce, ça ie pronom interrogatif/exclamatif ex : que in pronom indéfini ex : aucun po pronom possessif ex : sien re pronom relatif ex : qui ss pronom personnel sujet ex : il sd pronom personnel complément direct ex : le si pronom personnel complément indirect ex : me sl pronom personnel complément de lieu ex : y st pronom personnel tonique ex : moi sr pronom personnel réfléchi ex : se sp pronom personnel 'soi' 6.3.3 Code des sous-catégories de conjonctions cc conjonction de coordination ex : mais sc conjonction de subordination complétive ex : que sb conjonction de subordination de but ex : afin_que sh conjonction de subordination d'hypothèse ex : si so conjonction de subordination d'opposition ex : bien_que sp conjonction de subordination de comparaison ex : comme sq conjonction de subordination de conséquence ex : pour_que st conjonction de subordination de temps ex : lorsque su conjonction de subordination de cause ou argumentation ex : parce_que 6.3.4 Codes des sous-catégories d'adverbe et de certaines prépositions Li adverbe de lieu ex : dessus, avant Ma adverbe de manière ex : ainsi, ambigument, plus Qt adverbe de quantité ex : trop, plus Tp adverbe de temps ex : avant, jamais Ng adverbe de négation ex : jamais, non Af adverbe d'affirmation ex : certes Ar adverbe d'argumentation ex : d'ailleurs Dt adverbe de doute ex : peut-e3tre In adverbe d'interrogation ex : que, est-ce_que Ex adverbe d'exclamation ex : que Ö Ö"Ø#ÖÙ&Ú(Û*Ü+Ø Octobre 2001 9