L utilisation d Internet dans la commercialisation des produits de l industrie de la langue



Documents pareils
FEN FICHE EMPLOIS NUISANCES

Documentation Honolulu 14 (1)

TFC. (Téléphone, Fax, Courrier)

CHAPITRE VIII : L ORDINATEUR : UN OUTIL DE RECHERCHE DOCUMENTAIRE. Circulation de l information sur un réseau d ordinateurs

Rapport financier électronique

Politique de gestion documentaire

Guide de l utilisateur. Faites connaissance avec la nouvelle plateforme interactive de

Manuel Utilisateur Version 1.6 Décembre 2001

Prestation électronique de service pour la transmission d un bilan de phosphore

Initiation à la bureautique

Accès instantané aux mots et aux locutions Le dictionnaire électronique offre une traduction rapide d'un mot ou d'une locution

Solutions en ligne Guide de l utilisateur

IMPLANTATION D UN SYSTÈME DE GESTION ÉLECTRONIQUE :

Manuel d utilisation

pour les petites entreprises

Guide d administration de Microsoft Exchange ActiveSync

Administration de systèmes

MATRICE DES FONCTIONNALITES

1. Création du profil

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ. VOUS POUVEZ COMPTER SUR NOUS

Politique de gestion documentaire

Instructions d installation de IBM SPSS Statistics pour Windows (licence de site)

CRM pour le Service clients et l Assistance technique

Instructions d installation de IBM SPSS Statistics pour Windows (mono-utilisateur)

LIVRE BLANC. Migration de Magento Community Edition MD à Magento Enterprise Edition MD

A. Présentation. LanScanner2006

Courrier électronique : vocabulaire

Progiciel pour la configuration et la visualisation de régulateurs

Les 1 er pas sur. Guide d utilisation

FTP Expert 3 est idéal pour :

Access et Org.Base : mêmes objectifs? Description du thème : Création de grilles d écran pour une école de conduite.

Installation et utilisation du client FirstClass 11

CRM pour le marketing

Créer et partager des fichiers

Chapitre 1 Qu est-ce qu une expression régulière?

Contributions. Introduction

Comment utiliser FileMaker Pro avec Microsoft Office

Les documents primaires / Les documents secondaires

NiceLabel pour Services Microsoft Windows Terminal Serveur et Citrix MetaFrame

CRM pour le marketing

Recherche bibliographique

RESSOURCES MATÉRIELLES ET DOCUMENTAIRES CONSERVATION DES DOCUMENTS SEMI-ACTIFS. Guide


Efficace et ciblée : La surveillance des signaux de télévision numérique (2)

GPI Gestion pédagogique intégrée

Business Intelligence

C. SCIT Le 9 juillet 2003

Manuel d utilisateur BilanKine Version 1.5

Au-delà de la simple gestion de votre fonds documentaire, évoluez vers la gestion complète de vos flux d informations.

Notes de mise à jour. 4D v11 SQL Release 2 (11.2) Notes de mise à jour

Chef de file dans le développement de solutions de gestion de contenu

SpringerLink La Connaissance est importante. Choisissez SpringerLink.

16 septembre Lundi de l Economie l. rencement. Foix. CCI Ariège

HelpDesk. Sept avantages de HelpDesk

HelpDesk Fiche produit

PRÉSENTATION SOMMAIRE

Jura Miniguide Conseils pour mieux utiliser Jura

WinTask x64 Le Planificateur de tâches sous Windows 7 64 bits, Windows 8/ bits, Windows 2008 R2 et Windows bits

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Fiery E100 Color Server. Impression

Guide de l utilisateur Mikogo Version Windows

Cliquez pour du modifier titre le style

Vue d ensemble. Initiatives des données. Gestion de la trésorerie. Gestion du risque. Gestion des fournisseurs 2 >>

Procédure pour emprunter ou réserver un livre numérique

Guide de l administrateur DOC-OEMCS8-GA-FR-29/09/05

Pourquoi choisir la solution publicitaire Google AdWords?

SIGAFINANCE. Quoi de neuf et correctifs Version (20 février 2015)

NETWORK & SOFTWARE ENGINEERING MANUEL D UTILISATEUR. Logiciel TIJARA. NETWORK AND SOFTWARE ENGINEERING Manuel d'utilisateur "TIJARA" 1

Administration du site (Back Office)

Disque Dur Internet «Découverte» Guide d utilisation du service

Présentation de Firefox

Skype est-il su r pour les juges?

Retour table des matières

Situation présente et devis technique

RECOPLUS LOGICIEL DE GESTION DES RECOMMANDES NOTICE D UTILISATION DE RECOPLUS RESEAU. N de série

Utilisation du client de messagerie Thunderbird

Utilisation de la Plateforme Office365 et d Oultlook Web App

Thunderbird est facilement téléchargeable depuis le site officiel

Complaints Manager 4/06/2015 Page 1 Arpaweb 2015

Nos services de traduction Qualité. Rapidité. Professionnalisme.

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

ÉTAT DES LIEUX DE LA GESTION DE LA SÉCURITÉ ET DU BIG DATA

Qu est ce que Visual Guard. Authentification Vérifier l identité d un utilisateur

Manuel d utilisation du logiciel RÉSULTATS. Édition destinée aux départements

Website Express Créer un site professionnel avec Orange

Guide d intégration Dernière révision : juillet 2004

Niveau 1. Atelier d'initiation à l'ordinateur ... Fondation de la Bibliothèque Memphrémagog inc. Magog (Québec) J1X 2E7 Tél.

PRISE EN MAIN RAPIDE

Tsoft et Groupe Eyrolles, 2005, ISBN :

TABLE DES MATIÈRES CHAPITRE I. INTRODUCTION À LA VEILLE... 3

Les bibliothèques et les centres de documentation de l'enseignement tertiaire

Nouvelles technologies, nouveaux usages : les TIC*, quels impacts? * : technologies de l information et de la communication

Enquête sur les Technologies de l information et de la communication TIC2015 et le commerce électronique

L accès à distance du serveur

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Chapitre VII : Principes des réseaux. Structure des réseaux Types de réseaux La communication Les protocoles de communication

ACDQ : GUIDE DE CRÉATION DE VOTRE PAGE WEB

SCM Fournisseurs de services et délégués Matériel de formation à l intention des utilisateurs Nouveau-Brunswick, Canada

Transcription:

L utilisation d Internet dans la commercialisation des produits de l industrie de la langue Cet article vise à faire connaître le type de données linguistiques accessibles sur Internet. En outre, il propose des outils conçus par l industrie de la langue qui peuvent servir aux langagiers. Pour aiguiller les recherches sur le mode de diffusion des banques de terminologie, l article fait état des avantages et des désavantages de la commercialisation sur Internet tels que perçus par Machina Sapiens. En effet, l entreprise, qui se spécialise aussi en terminotique, utilise Internet pour diffuser son produit, un outil de recherche incluant un extracteur de mots-clés. Termes-clés: Internet; terminotique; extracteur de mots-clés; banque de terminologie; outil de recherche; industrie de la langue. Machina Sapiens est une entreprise de haute technologie qui mise sur l innovation, l excellence de ses produits et l expertise de son personnel. L entreprise a commercialisé une dizaine de progiciels, dont des logiciels de formation, des outils de programmation par objets et des outils de traitement de la langue dont le Correcteur 101. Machina Sapiens a remporté le Prix du «Meilleur concept logiciel» en 1986, le prix Mica pour la recherche en 1988, le Prix de la ministre de l Enseignement supérieur et de la Science en 1991, l Octas 93 de la technologie et le Prix du français en informatique 1994, décerné par l Office de la langue française. 1. Information linguistique sur Internet Internet regorge de données linguistiques. Pour le terminologue averti, il est possible de trouver toute l information nécessaire pour bâtir une fiche terminologique. Bon nombre de monographies portant sur des domaines de spécialité peuvent être consultées sur Internet. L accès à ces données est parfois gratuit, parfois très coûteux, selon le site qui l offre. En outre, l information offerte varie rapidement. Par exemple, ce qui était disponible gratuitement hier, ne l est plus aujourd hui, ou tout simplement n existe plus sur Internet. Dans le cadre d une démarche terminologique, il est important de tenir compte de l inexistence de normes sur Internet. En effet, Internet ne prescrit aucun processus d édition. Il est donc difficile pour le terminologue de connaître l identité de la source et de s assurer de l exactitude des données. Le terminologue doit être critique face à la qualité de la source. À titre d exemple, Machina Sapiens a trouvé les produits suivants: Corpus de textes en langue de spécialité; Listes de mots; Listes de mots fréquents; Dictionnaires de synonymes; Traducteurs bilingues ( accès informatique à un dictionnaire bilingue) Shake and bake demo FTP. Directory: members-only/tools/ translation/shake and bake/more info: info/0098. De plus, certains groupes mettent en commun leurs données linguistiques et les offrent à différents prix sur Internet. C est le cas du Consortium for Lexical Research (CLR) lexical@crl. nmsu. edu. La liste suivante est un ensemble de sites, de répertoires et de fichiers à consulter sur Internet. 135

ftp.cc.utexas.edu ftp.tex.ac.uk /pub/english /pub/archive/language/english /pub/archive/info/spanish-tutorial /pub/archive/language/italian ftp.cac.psu.edu /pub/courses/english kekule.osc.edu /pub/central-eastern - europe/russian/windows/ cyrwin/spanish.kbd qiclab.scn.rain.com /pub/wordlists/italian /pub/wordlists/spanish /pub/wordlists/german /pub/wordlists/dictionaries black.ox.ac.uk ftp.cs.tulane.edu cs.nyu.edu vax.cs.pitt.edu ftp.cs.yale.edu achilles.doc.ic.ac.uk freebsd.cdrom.com midway.uchicago.edu sol.cs.bucknell.edu relay.cs.toronto.edu oes.orst.edu sonata.cc.purdue.edu sumex-aim.stanford.edu mrcnext.cso.uiuc.edu ftp.spies.com ftp.apple.com sun.soe.clarkson.edu /pub/mac/excalibur-dictionaries/ NewGermanDictionary ( etc.) /doc/dictionaries/words.italian.z /pub/data/etext/roget.p2 /pub/next /Literature/Gutenberg/etext91/roget11 /info-mac/info/nms/roget-1911-thesaurus /pub/info-mac/info/nms/roget-1911- thesauru /pub/etext/etext91/roget13.txt /Library/Classic/roget.txt /alug/hypercard/roget.1.cpt.hqx /pub/src/getgrammar /pub/src/dictionary /archives/learning/grammar /pub/machine-learning- /prodigy/domains/grammar /pub/celia/english/grammar cmns.think.com ics.uci.edu databases ftp.latrobe.edu.au /wordlists/italian /wordlists/spanish /wordlists/dictionaries/roget.words.z /pub/rpg/new-words.spanish /pub/local/grishman/spanish-proteus-tar.t /pub/nlp/dictionaries/spanish-uni.dict /pub/nlp/grammar/comm-spanish.gram /pub/nlp/grammar/spanish.gram /pub/editors/ue310e/spanish.h /pub/lojban/etymology/spanish.voc /tex/aston/languages/babel/italian.doc /tex/aston/languages/babel/spanish.doc /.5/gutenberg/freenet/german-surrender /pub/tex/macintosh/utilities/excalibur/ italian-dictionary-s x aussi NewGermanDictionary- Sites FTP Obtenus du serveur Archie ( telnet archie. rutgers. edu, login archie, commandes «find english», «find grammar», etc.) Site Répertoire(s) et fichier(s) gum.isi.edu /share/pub/english-corpus-1 ftp.isi.edu /pub/english-corpus-1 ra.msstate.edu /pub/doc/words-l/funnies pronouncing.english ftp.cc.gatech.edu /pub/coc/graduate - info/international/intensive.english epas.utoronto.ca /pub/cch/italian /pub/cch/english /pub/cch/english/dictionaries/roget13a.zip /pub/cch/italian/wordlists/words.italian.z ftp.iro.umontreal.ca /ludeiro/ispell3.1.08/src/orig/languages/english 2 L application de la terminotique dans les outils de recherche sur Internet. Certains logiciels de recherche en vente sur Internet offrent des outils qui résultent de la terminotique. 2.1 InfoScan, un outil de recherche conçu par Machina Sapiens inc. À quoi sert InfoScan? InfoScan est un assistant personnel qui lit, filtre et classe les messages reçus d Internet. Il aide les utilisateurs qui sont submergés par les nouvelles (News) et le courrier électronique. Il repère pour eux les documents les plus susceptibles de les intéresser. InfoScan donne immédiatement accès aux documents les plus pertinents; l utilisateur n est donc plus obligé de lire tous les documents, ni leurs titres souvent peu évocateurs, ni même un seul mot de leurs textes. Les documents intéressants sont visibles d un coup d œil, ce qui évite des explorations fastidieuses et des lectures inutiles. Comment fonctionne InfoScan? Pour décrire ses intérêts à InfoScan, l utilisateur doit simplement taper des mots-clés dans des filtres. La particularité des filtres d InfoScan est qu ils permettent d accorder une pondération aux catégories de motsclés. Par conséquent, non seulement l utilisateur choisit le domaine de recherche, mais il décide aussi des relations entre les termes par rapport au domaine de sa recherche. De cette façon, InfoScan fait des recherches plus pointues avec plus d exactitude. D abord, InfoScan cherche les mots-clés dans l ensemble des 136

documents que lui indique l utilisateur. Puis, InfoScan affiche les résultats sur un écran de radar qui permet de consulter les documents les plus pertinents. Le terminologue peut ainsi fouiller plus à fond les sources terminologiques qu il possède sur support informatique. Notamment, InfoScan est doté d outils de tri, de recherche textuelle et de lecture de documents. À quoi ressemble InfoScan? L interface d InfoScan se divise en trois parties. D abord, il est composé principalement d un outil de visualisation graphique, inspiré de la métaphore du radar, qui permet de repérer rapidement les documents les plus pertinents, sans même lire un seul mot. Puis, il contient une zone du profil de l utilisateur qui permet de définir et de sélectionner des filtres, des sources d information ou collections et de définir des requêtes. Une requête est une association entre un filtre (termes d un domaine) et une collection de documents (sources d information). Enfin, son écran principal est aussi doté d une zone de retour d information qui contient le titre du document courant ainsi qu un aperçu de son contenu. Où peut-on se procurer InfoScan? La version 1.0 d InfoScan est offerte sur le site W3 de Machina Sapiens: http://www.machinasapiens.qc.ca. Après avoir téléchargé le logiciel, on peut l utiliser gratuitement en version de démonstration. Toutefois, toutes les fonctions de recherche du logiciel ne sont pas offertes en mode de démonstration. InfoScan deviendra pleinement fonctionnel une fois que l utilisateur sera enregistré et qu il aura payé la somme requise. Qui a contribué à la réalisation d InfoScan? Le consortium Canarie ( Canadian Network for the Advancement of Research, Industry and Education) a participé financièrement à la réalisation L écran de visualisation d InfoScan après une requête. Les meilleurs articles sont situés au centre du radar. d InfoScan. Le CEFRIO (Centre francophone de recherche en informatisation des organisations) a contribué au transfert d expertise d une équipe de recherche universitaire. L outil d extraction de mots-clés InfoScan offrira dans une version ultérieure un extracteur de mots-clés trilingue. Cet outil cherche dans les textes les mots-clés et les inclut automatiquement dans les filtres de recherche. L outil d extraction de mots-clés permettra aux utilisateurs de remplir automatiquement leurs filtres de recherche. Parfois, l utilisateur ne connaît pas suffisamment les domaines des recherches qu il désire effectuer sur Internet. Afin d entrer correctement les mots-clés qu il recherche dans les filtres d InfoScan, il peut utiliser l extracteur de mots-clés. Pour ce faire, il doit fournir à InfoScan un texte portant sur le domaine de recherche en question. À l aide de ce texte, l outil d extraction de mots-clés repérera automatiquement les motsclés qui s y trouvent et les inclura dans le filtre de recherche. Le nouveau filtre ainsi créé sera plus représentatif du domaine et servira à trouver de l information pertinente qui intéresse vraiment l utilisateur. Les textes repérés par InfoScan à l aide de ce filtre traiteront du même domaine de recherche que le texte de départ, c est-à-dire qu ils contiendront les mêmes mots-clés. Quant à la façon d entrer les mots-clés dans le filtre de recherche, l extracteur de mots-clés connaît leur valeur conceptuelle par rapport au texte et leur accorde automatiquement une pondération. Cet outil est capable d extraire des termes simples et complexes à partir d écrits français, anglais et espagnols. 137

2.2 AnchorPage D autres entreprises aux États- Unis telles qu Iconovex ont choisi d offrir aux utilisateurs d Internet un extracteur de concepts pour faire de l indexation. Cet outil repère dans les textes les mots représentant des concepts et en fait des index de recherche. 3 Mode de commercialisation sur Internet 3.1 Les avantages de la commercialisation des produits de l industrie de la langue sur Internet: Accès international instantané à une clientèle de millions d internautes; Rapidité de distribution (quasi instantanée); Élimination des frais de transport, d emballage, de support magnétique et d impression de manuels; Réduction des frais de soutien technique, meilleure qualité du service; Cycles de production et de diffusion raccourcis; Bêta testeurs facilement accessibles; Publicité à faible coût directement sur Internet; Possibilité d automatisation poussée des transactions; Prix plus bas pour les utilisateurs. 3.2 Les problèmes auxquels est confrontée l entreprise Machina Sapiens dans l établissement d une procédure de vente sur Internet: Manque de sécurité des transactions, il n existe toujours pas de normes de sécurité pour échanger des renseignements confidentiels; Manque de confiance de la part des clients et des institutions financières; Clientèle de Internet habituée aux logiciels gratuits; Besoin de normes communes pour favoriser le commerce sur Internet entre différents pays; Bruit sur Internet ( l information est plus disponible, par contre elle est moins facile à trouver que dans une bibliothèque par exemple); Diffusion de l information publicitaire difficile ( cette démarche requiert un certain tact, que l on appelle dans le jargon anglophone de Internet, le Netiquette). 4 Mode d acquisition d InfoScan Modalités d acquisition du logiciel Une version de démonstration limitée au traitement de vingt documents est offerte gratuitement sur Internet. Pour rendre cette version complètement fonctionnelle, le client doit: Remplir un formulaire d enregistrement qui se trouve sur le site. Le client recevra dans les vingtquatre heures un numéro de commande personnel calculé par InfoScan à partir de son adresse Internet et de la configuration de son ordinateur; Commander le produit par télécopieur, par téléphone ou par la poste en indiquant le numéro de commande reçu. Une fois le paiement validé, un jeton est envoyé au client pour rendre la version de démonstration pleinement fonctionnelle. Le jeton est libellé au nom du client et de son adresse électronique. C est là un moyen de protection de logiciel davantage dissuasif, car les coordonnées du client apparaissent sur chaque copie piratée. À l avenir, si les normes de sécurité sur Internet entrent en vigueur, il sera possible d instaurer un service commercial sécuritaire sur le réseau Internet. Machina Sapiens fera alors appel à une technologie adoptée par Netscape et ses partenaires dont Bank of America et MasterCard. 5 Protocole standard de communication entre une banque de terminologie et des programmes informatiques (pour la diffusion des données sur disque optique compact) Une entreprise privée, ou même un gouvernement, peut permettre aux fabricants de logiciels d utiliser sa banque de terminologie moyennant le paiement d une licence par exemplaire du logiciel vendu. Pour donner accès à des banques de terminologie, il faut établir un protocole de communication standard entre la banque et l interface des divers programmes d exploitation. Ce procédé permet à différents diffuseurs de concevoir des applications variées qui utilisent le contenu de la banque de terminologie. Ce procédé permet aussi une utilisation diversifiée des données terminologiques tout en protégeant le format et le contenu des fiches terminologiques sous format crypté. Dans le domaine commercial, deux types de consultations pourraient coexister. D une part, la banque de terminologie en entier serait disponible sur un disque optique compact. Quant aux vocabulaires spécialisés et à l utilisation restreinte des données qui apparaissent sur la fiche, ils pourraient être accessibles sur Internet aux utilisateurs qui possèdent un mot de passe. On peut 138

obtenir ce dernier soit par abonnement ou moyennant des frais de consultation. 6 Question ouverte: L accès aux banques de terminologie doit-il être gratuit? Il serait présomptueux de répondre trop rapidement et sans équivoque à cette question. Toutefois, les renseignements suivants porteront sans doute à réflexion. D abord, il faut constater que toute information gratuite qui se trouve sur Internet peut servir au développement de produits commerciaux de tous genres, et ce, partout dans le monde. Les industries de la langue sont friandes des données linguistiques qui alimentent leurs produits. Pour éviter que les grandes entreprises qui profitent de budgets colossaux ne viennent rivaliser avec l entreprise de la région, ou les services gouvernementaux qui ont eux-mêmes mis sur pied la banque de terminologie, deux solutions sont proposées: Réclamer des frais d accès; Surveiller l identité de celui qui télécharge les données terminologiques (ce qui est difficile à effectuer de façon certaine). Nathalie Côté, Les Logiciels Machina Sapiens, Québec. 139