Les outils informatiques de la Génétique :



Documents pareils
Présentation Internet

18 TCP Les protocoles de domaines d applications

LE RESEAU GLOBAL INTERNET

Le réseau Internet.

Cours CCNA 1. Exercices

Programmation Internet Cours 4

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

Le Web et Internet. A. Historique : B. Définitions : reliés entre eux via un système d interconnexion.

Glossaire. ( themanualpage.org) soumises à la licence GNU FDL.

Internet et Programmation!

TIC. Réseau informatique. Historique - 1. Historique - 2. TC - IUT Montpellier Internet et le Web

Manuel d utilisation

Guide de l utilisateur. Faites connaissance avec la nouvelle plateforme interactive de

La messagerie électronique avec La Poste

Formation à la recherche documentaire sur le web

Fonctionnement d Internet

Solutions en ligne Guide de l utilisateur

Créer et partager des fichiers

Manuel d utilisation du logiciel RÉSULTATS. Édition destinée aux départements

Maîtrisez votre Navigateur

Atelier Internet de base ( Internet I ) ... JB 14 septembre 2008 (Canevas original : Marcel Pouliot)

MEDLINE BANQUE DE DONNÉES EN MÉDECINE INTERFACE PUBMED INITIATION

DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION

Gestion de références bibliographiques

Services bancaires par Internet aux entreprises. Guide pratique pour : Rapports de solde Version

Création, analyse de questionnaires et d'entretiens pour Windows 2008, 7, 8 et MacOs 10

INTERNET, C'EST QUOI?

ContactForm et ContactFormLight - Gestionnaires de formulaire pour Prestashop Edité par ARETMIC S.A.

Serveurs de noms Protocoles HTTP et FTP

Internets. Informatique de l Internet: le(s) Internet(s) Composantes de l internet R3LR RENATER

Recherche et veille documentaire scientifique

LISTES DE DISTRIBUTION GÉRÉES PAR SYMPA DOCUMENT EXPLICATIF DE L'INTERFACE WEB À L'INTENTION DES ABONNÉS

!" #$%&'(&)'*'+,--./&0'1&23,+2.)$4$%52'&%'6.%&2'

GUIDE MEMBRE ESPACE COLLABORATIF. Février 2012

Les services usuels de l Internet

Le logiciel de création de site internet IZISPOT est un outil très puissant et qui est assez simple après quelques temps d utilisation.

Services sur réseaux. Trois services à la loupe. Dominique PRESENT Dépt S.R.C. - I.U.T. de Marne la Vallée

ENDNOTE X2 SOMMAIRE. 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque

Manuel d Administration

GENERALITES. COURS TCP/IP Niveau 1

Prestation électronique de service pour la transmission d un bilan de phosphore

Memento de la recherche documentaire en santé

Table des matières ENVIRONNEMENT

Chef de file dans le développement de solutions de gestion de contenu

iil est désormais courant de trouver sur Internet un document

Table des matières...2 Introduction...4 Terminologie...4

Connected to the FP World

Atelier Le gestionnaire de fichier

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure

Guide d utilisation. Version 1.1

Guide d installation

Initiation à la recherche documentaire LA RECHERCHE SUR INTERNET

CONTACT EXPRESS 2011 ASPIRATEUR D S

Organiser le disque dur Dossiers Fichiers

Orientations pour la gestion documentaire des courriels au gouvernement du Québec

Écriture de journal. (Virement de dépense)

Guide d utilisation WEBPORTAL CPEM Portail d Applications Web CPEM

Club informatique Mont-Bruno Séances du 18 janvier et du 17 février 2012 Présentateur : Michel Gagné

CHAPITRE 3 : INTERNET

Encyclopaedia Universalis Guide d utilisation

Nokia Internet Modem Guide de l utilisateur

Répondre à un courrier - Transférer un courrier 20

Guide de l utilisateur Usagers d œuvres

Cisco Certified Network Associate

Une ergonomie intuitive

AIDE MEMOIRE. Forprev. De l habilitation à la gestion de sessions. Page 1 sur 55

Table des matières. BIENVENUE À UNIVERIS INVESTOR WEB

CONDITIONS D UTILISATION VERSION NOMADE

Itium XP. Guide Utilisateur

Comment accéder à d Internet Explorer

Base de données bibliographiques Pubmed-Medline

Manuel d utilisation du site web de l ONRN

Démarrer et quitter... 13

On trouvera sur le site du CCDMD un exemple d album construit avec Cantare. (

Paiement sécurisé sur Internet. Tableau de bord Commerçant

Internet haute vitesse - Guide de l utilisateur. Bienvenue. haute vitesse

Algorithme. Table des matières

Chapitre VII : Principes des réseaux. Structure des réseaux Types de réseaux La communication Les protocoles de communication

Afin d accéder à votre messagerie personnelle, vous devez vous identifier par votre adresse mail et votre mot de passe :

Guide d installation et de configuration du serveur de messagerie MDaemon

Documentation Honolulu 14 (1)

Windows Internet Name Service (WINS)

claroline classroom online

FileMaker Server 14. Guide de démarrage

Configuration du nouveau Bureau Virtuel (BV) collaboratif de Lyon I

C. SCIT Le 9 juillet 2003

La navigation sur le Web avec Internet Explorer 6 Première approche

Les entreprises en France ont généralement le choix entre deux genres de terminaisons : société.com société.net société.org

(Mis à jour : 7 déc. 12)

Lycée polyvalent Langevin-Wallon Champigny sur Marne Val de Marne

Service On Line : Gestion des Incidents

UltraBackup NetStation 4. Guide de démarrage rapide

Algorithmique et langages du Web

Système de Gestion Informatisée des. Exploitations Agricoles Irriguées avec Contrôle de l Eau

Table des Matières. Pages 3-4. A propos d emblue. Page 5. L environnement emblue. Création d une campagne d marketing. Pages 6-15.

Base de données relationnelle et requêtes SQL

Guide pour les chercheurs. Version 1.0

Copyright Arsys Internet E.U.R.L. Arsys Backup Online. Guide de l utilisateur

GUIDE UTILISATEUR APD

FileMaker Server 14. Aide FileMaker Server

Transcription:

Faculté de Médecine de Tunis DEA de Génétique Humaine Mémoire de 2ème année DEA Les outils informatiques de la Génétique : Exploitation des banques de données sur l Internet Présenté par le Docteur Neila ATTIA ROMDHANE Sous la direction du Professeur Habiba CHAABOUNI Composition du Jury Président : Professeur Habiba CHAABOUNI (Faculté de Médecine de Tunis) Membres : Professeur Farouk KAMOUN (Ecole Nationale des Sciences Informatiques) Professeur Béchir ZOUARI (Faculté de Médecine de Tunis) Professeur Agrégé Ridha MRAD (Faculté de Médecine de Tunis) Professeur Agrégé Mansour BEN ABDALLAH (Faculté de Médecine de Tunis) 1998-1999

Je dédie ce mémoire à ma mère, feue Halima Ben Amor, qui n a cessé de me recommander, jusqu à ses toutes dernières heures, de consacrer mon énergie à la Recherche. C était à l époque où nous nous entêtions encore à poursuivre l opération Téléthon. Militante avant-gardiste, ayant consacré sa vie à la promotion de la Femme et éternellement soucieuse de l image de notre cher pays à l étranger, elle avait compris que la Tunisie devait miser sur ses intellectuels et ses chercheurs pour occuper une place de choix à l échelle internationale. C est donc pour elle, pour ne pas trahir sa confiance, que je me suis engagée dans le DEA de Génétique. Je souhaite exprimer toute mon admiration et mon affection à mon père, Abdelmajid Attia, qui m a notamment appris que l on peut apprendre à tout âge. Sa vaste culture n a d égal que son plaisir à acquérir le Savoir et à communiquer la Connaissance. Plus connu comme Homme de Lettres, que de fois il m a surprise par la pertinence de ses questions sur des sujets scientifiques des plus pointus! J espère qu il trouvera dans ce travail quelques réponses aux nombreuses questions qu il se pose sur l Internet et la Génétique. Ce travail n aurait pu être achevé sans l inconditionnel soutien de mes proches. Je les remercie tous, et particulièrement Mouna, de s être «laissés négliger» pour me permettre de vouer tout mon temps à cette recherche. ii

Remerciements Nous souhaitons exprimer nos vifs remerciements à Madame et Messieurs les membres du Jury qui ont eu l amabilité d accepter de juger cette recherche. Nous espérons trouver, dans leurs critiques, de nombreuses suggestions utiles à l amélioration du contenu de ce travail. Nous devons à Madame le Professeur Habiba Chaabouni l idée brillante de ce sujet de mémoire : Produire un document, transformable en site Web, permettant de guider les généticiens dans l exploitation des banques de données de Génétique disponibles sur l Internet. Madame le Professeur Habiba Chaabouni n a cessé de militer pour promouvoir la Génétique Humaine en Tunisie, développer une recherche de qualité dans ce domaine et ce depuis l époque où la Génétique ne constituait que quelques chapitres des sciences biologiques. C est pourquoi, nous lui sommes infiniment reconnaissante de la confiance qu elle nous a témoignée en nous proposant ce travail et en acceptant de le diriger. Nous sommes redevable aux Docteurs Ségolène Aymé (Directeur d Orphanet, Infobiogen, Paris, lieu du stage que nous avons effectué en septembre 1999), Jamel Chelli (Directeur de recherche en Génétique Moléculaire à Cochin, Paris) et Ridha Mrad (Professeur Agrégé de Génétique à la Faculté de Médecine de Tunis) pour l aide précieuse qu ils nous ont apportée au cours de cette recherche. Nous exprimons, à nos enseignants de première année de DEA, notre respect et notre gratitude pour la qualité du savoir et du savoir faire qu ils ont bien voulu nous transmettre. Enfin, nous exprimons notre profonde gratitude à Monsieur Mohamed Néjib Youssef, Directeur Général de l Institut Salah Azaiez, qui a su nous apporter le soutien nécessaire à la réalisation de ce travail. iii

Table des Matières INTRODUCTION... 1 I. Présentation de l Internet...3 I.1. Historique...3 I.2. Navigation sur l Internet...4 I.2.1. Connexion à l Internet...4 I.2.2. Adresse URL d un site...5 I.2.3. Fonctions de navigation...6 I.2.4. Sauvegarde de l information...7 I.3. Droit d auteur et propriété intellectuelle...7 I.4. Sécurité et confidentialité...8 II. Services accessibles par l Internet...9 II.1. Services d information ou de traitement...9 II.1.1. Exécution à distance : Telnet, X-Window...9 II.1.2. Transfert de fichiers : FTP et Archie...9 II.1.3. Accès en mode Gopher...10 II.1.4. Accès en mode HTTP...10 II.2. Services de communication...11 II.2.1. Communication directe entre utilisateurs...11 II.2.2. Courrier électronique...11 II.2.3. Forums et listes d envoi...12 III. Recherche de ressources sur l'internet...13 III.1. Formulation des requêtes...13 III.1.1. Phrases ou mots clés?...13 III.1.2. Logique booléenne...14 III.1.3. Minuscules, majuscules et caractères composés...15 III.1.4. Attributs et champs...15 III.1.5. Autres points...16 III.2. Outils généralistes de recherche...16 III.2.1. Moteurs de recherche...16 III.2.2. Méta-moteurs ou méta-index...18 III.2.3. Répertoires thématiques...19 III.2.4. Répertoires de guides...19 III.2.5. Sélection d un outil de recherche...20 III.3. Evaluation des ressources de l Internet...20 iv

MATÉRIEL ET MÉTHODES... 22 I. Matériel d étude...22 I.1. Catégories de ressources...22 I.2. Outils spécialisés de recherche...23 I.3. Banques de données...24 I.3.1. Concept de banque de données...24 I.3.2. Critères d inclusion...27 I.3.3. Critères d exclusion...27 I.4. Besoins en Génétique Humaine...28 II. Méthodes...29 II.1. Répertorier les catégories de ressources...29 II.1.1. Recensement par les outils généralistes de recherche...29 II.1.2. Stage à Orphanet...30 II.1.3. Exploration de l Internet...30 II.2. Identifier les outils utiles au recensement des banques...31 II.3. Recenser les banques de données...31 II.3.1. Transformation des données en tables...31 II.3.2. Mise en relation des différentes tables...32 II.3.3. Elaboration du HGCat...33 II.4. Classer les banques selon les besoins...35 II.4.1. Principes de la Classification...35 II.4.2. Catégories de la classification adoptée...36 RÉSULTATS... 38 I. Ressources utiles à la Génétique sur le Web...38 I.1. Serveurs de Génétique et de Biologie Moléculaire...38 I.1.1. Serveurs de Génétique Humaine...38 I.1.2. Principaux serveurs multi-fonctionnels...40 I.1.3. Serveurs de Biologie Moléculaire...43 I.2. Outils informatiques de la Génétique...45 I.2.1. Outils d information par navigation...46 I.2.2. Outils de traitement des données...49 I.3. Outils de Communication...55 I.3.1. Communication directe...55 I.3.2. Communication indirecte...55 II. Outils spécialisés de recherche...57 II.1. Guides de ressources spécifiques...57 v

II.1.1. Guides de ressources de Génétique Clinique...57 II.1.2. Guides de ressources documentaires...58 II.1.3. Guides de ressources de Génétique Moléculaire...58 II.1.4. Guides de banques de Génétique Moléculaire...59 II.2. Moteurs spécialisés de recherche...60 II.2.1. Moteurs spécialisés de recherche pour la Génétique Médicale...60 II.2.2. Moteurs spécialisés de recherche pour la Génétique Moléculaire...62 II.2.3. Cas particulier du Bio Netbook...62 II.3. Catalogues de banques ou de logiciels...63 II.3.1. DBCat...64 II.3.2. BioCat...65 II.3.3. DATABANKS...65 II.3.4. LIMB...66 II.4. Collections de banques de la Revue Nucleic Acids Research...67 II.5. Outils retenus pour le recensement...68 III. Banques interrogeables en Génétique Humaine...69 III.1. Outils d interrogation des banques de données...69 III.1.1. Exemples d outils exploitant spécifiquement une banque...69 III.1.2. Exploitation multi-banques...70 III.1.3. Exploitation intégrée des banques de données...74 III.2. Recherche documentaire...76 III.2.1. Medline...76 III.2.2. Autres banques de références documentaires...78 III.2.3. Références de techniques et d analyses moléculaires...79 III.3. Analyses de séquences...79 III.3.1. Recherche de séquences...79 III.3.2. Evolution des Espèces et Phylogénie...82 III.3.3. Recherche de structures...82 III.3.4. Recherche de motifs...85 III.4. Outils de cartographie et de diagnostic génétique...86 III.4.1. Amorces et oligonucléotides...86 III.4.2. Outils utiles à la PCR...86 III.4.3. Enzymes de restriction...87 III.4.4. Banques de cdna...87 III.4.5. Marqueurs polymorphes...88 III.4.6. Vecteurs...88 III.4.7. Cultures cellulaires...89 III.5. Cartes du Génome...90 III.5.1. Cartes génétiques et cartes hybrides...90 III.5.2. Cartes physiques...91 vi

III.5.3. Cartes intégrées...92 III.5.4. Cartes par chromosome...92 III.5.5. Cartes d un chromosome...93 III.5.6. Carte de la Mitochondrie...93 III.5.7. Cartographie comparée...94 III.6. Etude des gènes...95 III.6.1. Expression des gènes...95 III.6.2. Identification et structure des gènes...96 III.6.3. Description des gènes et cartographie des loci...97 III.6.4. Polymorphisme et fréquences allèliques...97 III.6.5. Banques générales de mutation...98 III.6.6. Mutations en Oncologie...100 III.6.7. Mutations spécifiques...101 III.7. Etude des chromosomes...103 III.8. Etude des maladies génétiques...104 III.8.1. Prévalence des maladies génétiques...104 III.8.2. Aide au diagnostic clinique...104 III.8.3. Prise en charge des maladies...105 III.8.4. Traitement et essais thérapeutiques...106 III.8.5. Aide au diagnostic biologique...107 III.8.6. Orientation et information des patients...107 DISCUSSION... 108 CONCLUSION... 114 RÉFÉRENCES DOCUMENTAIRES... 120 vii

Introduction Pour le généticien, l ordinateur se trouve en position déterminante dans la découverte des gènes et de leurs fonctions. La conception d outils informatiques de plus en plus performants, à l usage des généticiens et des biologistes, a permis le lancement de projets «géants» tels que The Human Genome Project a, 1. L accessibilité par l Internet b à des réseaux c informatiques, jusque là réservés à certains groupes de recherche, a favorisé l échange d informations entre chercheurs et a permis à la collaboration internationale et interdisciplinaire d être plus efficace. L Internet, avec ses centaines de millions de documents et outils en ligne, constitue, pour certains, une immense banque de données de taille infinie. Il n est plus nécessaire de se déplacer ou de disposer d outils très performants pour analyser ses données. Il suffit de se connecter à un site qui offre le service souhaité puis de lancer sa requête. Si le principe paraît simple, son application ne l est point. Non seulement il faut savoir localiser les adresses de sites qui peuvent répondre à ses besoins, mais aussi, il faut apprendre à sélectionner et à utiliser les outils disponibles. De nombreux outils, utiles à la Génétique, sont devenus accessibles par l Internet et souvent gratuitement. Ces outils peuvent être regroupés comme suit. Les outils d information par navigation sont les plus nombreux. Ce sont des documents hypertextes d qui guident l utilisateur (listes de serveurs, de bibliothèques, de banques, de logiciels, de projets de cartographie ) ou qui lui a Human Genome Project : Lancé en 1990 pour une durée de 13 ans et dirigé par l U.S. Department of Energy et les National Institutes of Health, il a pour objectifs d identifier l ensemble des 80 000 à 100 000 gènes humains, de déterminer les séquences des 3 milliards de paires de bases qui composent l ADN humain, de stocker ces informations dans des banques de données, de développer les outils d analyse des données et de relever les conséquences éthiques, légales et sociales qu engendrerait ce projet. b Internet (le réseau des réseaux) : Réseau global à haut débit composé de réseaux informatiques de tailles différentes, reliés et communiquant à l aide de passerelles utilisant un langage commun. c Réseau : Résultat de la connexion d un ensemble d entités ressemblantes. d Hypertexte : Système de représentation et de diffusion d informations par lequel on peut faire apparaître, grâce à des hyper-liens (texte souligné ou boutons), des documents éparpillés sur différents sites sous forme unitaire. Par extension, ce terme désigne aussi tout texte comportant des hyper-liens.

présentent différentes formes de documents (articles, cours, techniques biologiques, tables de codes, dictionnaires, lexiques ). Les outils d information par interrogation utilisent des banques pour stocker et organiser les données. Chaque banque est exploitée par un logiciel (programme informatique). Ce dernier traite le contenu des requêtes formulées par l utilisateur et produit une réponse composée d informations sur les maladies, gènes, matériel biologique, références documentaires ou autres types de ressources composant la banque de données. Les outils de traitement des données sont téléchargeables ou directement accessibles. Ils se présentent sous forme de logiciels ou de systèmes d analyse (intégrant de nombreux logiciels). Ils sont de plus en plus performants. Ils sont utilisés pour : Analyser les liaisons dans les études de Mapping. Analyser les séquences nucléotidiques ou protéiques pour comparer des séquences ou prédire, à partir d une séquence nucléotidique, le gène, la structure secondaire ou tertiaire de la protéine qui peut en résulter. Examiner les nouveaux résultats soumis aux banques de séquences a. La localisation des outils informatiques de la Génétique Humaine et plus particulièrement l exploitation des outils d information par interrogation (localisation, sélection et utilisation des banques de données) constituent l objet de cette recherche. Mais auparavant, il nous semble opportun de rappeler, dans la suite de cette partie introductive, certaines notions relatives à l Internet. Afin que ce document soit transformable en page Web, nous nous sommes astreinte à garder trace des hyper-liens b. Nous avons associé, aux termes soulignés, une note de bas de page c traduisant l adresse cachée par l hyper-lien. Les notes de bas de pages, signalées par a Banques de séquences : volumineuses banques composées de séquences d acides nucléiques ou de séquences protéiques. Leur taille doublerait tous les deux ans. Elles sont hébergées par des serveurs équipés d ordinateurs à multiples processeurs et travaillant en parallèle. b Hyper-liens ou liens hypertextes : ils se présentent sous forme de mots soulignés ou de «boutons» qui lient le document parcouru à d autres documents. Chaque lien contient l adresse du document visé. Un simple clic permet de l atteindre. c Notes de bas de page relatives aux hyper-liens : elles sont temporaires et disparaîtront lors de la transformation du document en page Web. 2

une lettre de l alphabet en exposant, sont aussi utilisées pour définir une notion ou apporter un complément d information. Les références bibliographiques figurent en fin de document par ordre d apparition dans le texte. Elles sont signalées dans le document par un numéro en exposant. L objet de ces références peut être un article de revue, un livre ou monographie, un document hypertexte récupéré de l Internet ou d un CD-ROM. I. Présentation de l Internet 2, 3, 4, 5 L Internet résulte de la convergence de technologies de l Information et de Communication. Il permet de chercher, d échanger, de traiter l information et de bâtir des connaissances. En quelques secondes et simultanément, on peut se connecter à des ressources disséminées partout dans le monde. Des informations circulent, des projets se réalisent, des collaborations s effectuent, avec des partenaires, des individus, des groupes situés à des milliers de kilomètres. Plusieurs utilisateurs et spécialistes comparent l essor et l impact de l Internet à des événements qui ont marqué et changé l histoire (imprimerie, téléphone et télévision). Pour certains, l Internet est un «Bit bang». Pour d autres, c est l espoir d un échange d informations placé sous le signe de l égalité des chances à l accès au savoir. I.1. Historique En 1969, l armée américaine a lancé des recherches pour interconnecter des ordinateurs tout en évitant un lieu centralisé. En 1972, le premier protocole d envoi et de réception de courrier électronique est mis en route aux USA. En 1973 et pour la première fois, une connexion internationale, entre deux collèges militaires (Angleterre et Norvège), utilise le FTP a pour échanger des fichiers de taille importante. Pour rompre l isolement des réseaux épars, l idée vint, en 1973, de mettre en place des passerelles b communiquant à l aide d un langage commun dénommé IP c. Il a été ensuite complété par le TCP a pour donner le TCP/IP a FTP (File Transfer Protocol) : Protocole permettant le transfert rapide de fichiers numériques de grande taille entre sites raccordés à l Internet. b Passerelle : Terme désignant un ordinateur interconnectant deux réseaux pour n en faire qu un. c IP (Internet Protocol) : Langage commun utilisé par les passerelles (voir ce mot), permettant ainsi la communication entre différents réseaux. C est un protocole de connexion qui gère l envoi de paquets de données via l Internet. 3

harmonisant ainsi la communication entre réseaux. Progressivement et dès 1981, les passerelles ont permis de consolider et de relier les réseaux suivants : NSFNet (National Science Foundation, USA), ARPANet (de l armée américaine), RISQ et CANet (du Québec et du Canada). RENATER (réseau national français des universités et de la recherche) n a vu le jour qu en 1992. Jusqu en 1990, la gestion du réseau a été assurée par des organismes parmi lesquels se trouvent les réseaux universitaires (principaux fournisseurs d accès et utilisateurs des services). Pour favoriser la privatisation des Télécommunications, le gouvernement américain a abandonné, au début des années 1990, le NSFnet et le projet ARPANET. Le lancement, en 1993, du projet Information Super Highway (projet de 17 milliards de dollars pour la construction d un réseau de fibres optiques) a entrouvert la porte aux activités commerciales sur l Internet. On peut, lors et déjà, constater que celles-ci se développent rapidement. L interconnexion des ordinateurs est passée de 200 en 1981 à 500 000 en 1991. Depuis, l architecture de l Internet ne cesse de s étoffer en doublant pratiquement d une année à l autre. En 1997, l Union Internationale des Télécommunications estimait le nombre de serveurs b à 16 millions et le nombre d internautes à 60 millions. A l inverse du réseau téléphonique, l Internet à l avantage de ne reposer sur aucune centralisation ni point de concentration privilégié. Tous les réseaux interconnectés sont sur un même pied d égalité. I.2. Navigation sur l Internet I.2.1. Connexion à l Internet Le protocole TCP/IP inclut un système universel d adresses qui permet à chaque nœud de l Internet d être localisé sans équivoque. Chaque ordinateur branché sur l Internet a une adresse IP c. On peut faire correspondre à l adresse IP une adresse écrite en caractères alphanumériques : nom Internet d. C est un serveur DNS a qui établit la correspondance a TCP (Transmission Control Protocol) : Protocole de contrôle de la transmission à travers l Internet. b Serveur : Terme désignant un ordinateur hôte hébergeant les fichiers ou informations envoyés par des ordinateurs clients. c Adresse IP (numéro Internet) : Entité numérique constituée d une série de quatre nombres, allant chacun de 0 à 255, séparés par des points. Sa structure est hiérarchique. d Nom Internet : Adresse alphanumérique (nom) correspondant à l adresse IP (numérique). Ainsi, à l adresse IP <132.208.217.1> correspond le nom Internet badaduq.uqam.ca. 4

entre les deux dénominations. De nombreux ordinateurs reliés à l Internet n ont qu une adresse IP. C est le cas de la grande majorité des micro-ordinateurs qui ne sont que clients. Ce n est que lorsqu une machine devient serveur qu on lui accorde un nom Internet. Le fournisseur d accès b délivre une adresse IP à l ordinateur client, l adresse IP de son serveur DNS ainsi que le(s) numéro(s) de téléphone à appeler. Ces informations doivent être introduites à travers le panneau de configuration ou le logiciel de navigation de l ordinateur client. Si ce dernier est un micro-ordinateur multimédia, équipé d un modem c ou bien relié par câble à un réseau, l utilisateur peut se connecter et accéder à l Internet. I.2.2. Adresse URL d un site Les adresses URL d sont utilisées par les logiciels de navigation e pour accéder à différents services de l Internet. Elles sont d introduction récente. Elles se présentent sous la forme générale protocole://adresse_du_serveur/répertoire/fichier. Voici quelques exemples : http://www.bibl.ulaval.ca/ress/socio.html ftp://ftp.crihan.fr telnet://hollis.harvard.edu/ L adresse URL spécifie le type de service Internet (http, ftp, telnet, ) ainsi que la catégorie d institution à laquelle appartient le serveur. Dans telnet://hollis.harvard.edu/, «.edu» signifie que le serveur est celui d une institution éducative. Dans d autres cas, on utilisera l extension «.ac» pour institution académique, «.com» pour groupe commercial, «.gov» pour institution gouvernementale, «.org» pour organisation nationale ou internationale a Serveur DNS (Domain Name Server) : Serveur établissant la correspondance entre l adresse IP et le Nom Internet d un serveur relié à l Internet. b Fournisseur d accès : Peut être un réseau (RNU : Réseau National Universitaire, RNS : Réseau National de la Santé en Tunisie) ou bien un serveur commercial (Global-net et Planet en Tunisie, AOL et Compuserve internationaux). c Modem (Modulator Demodulator) : Dispositif permettant de convertir des signaux électriques entre un ordinateur et une ligne téléphonique. C est un appareil qui utilise une ligne téléphonique pour transmettre de l information électronique. Son débit maximal est exprimé en bits per second (bps). d URL (Uniform Resource Locator) : Adresse électronique désignant une ressource ou site sur l Internet. Elle est précédée d un préfixe dépendant du type de ressource (HTTP, FTP, Telnet, ). e Logiciels de navigation (Netscape, Explorer ) : Logiciels permettant l exploration de l Internet. Ils sont désignés par navigateurs, fureteurs ou browsers. 5

Dans, http://www.bibl.ulaval.ca/ress/socio.html, «.ca» signifie que le serveur se trouve au Canada. L extension est «.tn» pour Tunisie, «.fr» pour la France, «.uk» pour le Royaume Uni, «.ch» pour la Suisse, «.jp» pour le Japon Notons, qu il est exceptionnel que les sites des Etats Unis précisent «.us» dans leurs adresses URL. Il est fréquent que des sites, non américains, évitent d inclure ce type d extension dans leurs adresses URL pour ne pas «manquer de crédibilité». On peut donc les confondre avec les sites américains. Par conséquent, il est impossible de reconnaître un site des Etats Unis par simple exclusion. Il est temps que les sites américains incluent l extension «.us» dans leurs adresses URL. Il est important dans une adresse URL de respecter strictement les majuscules et minuscules, tous les caractères dont la ponctuation. On n utilise pas de caractères avec accents. Si une adresse URL ne fonctionne pas, on peut la tronquer (enlever les répertoires et fichiers) pour arriver, au moins, sur la page d accueil du serveur. À partir de là, on peut en général retrouver l information recherchée en naviguant à travers les différentes pages offertes. I.2.3. Fonctions de navigation Quand on active un logiciel de navigation, on aboutit à une page désignée «Démarrage», «Accueil» ou «Home page». Quand ce n est pas le fabriquant de la machine qui y impose son site, c est le logiciel qui y présente le site de son fabricant. Cette page peut être modifiée dans le panneau de configuration ou dans les options du logiciel. Il s agit de remplacer l adresse URL imposée par celle du site par lequel on souhaite chaque fois commencer. Pour naviguer, il faut connaître les fonctionnalités de base du logiciel de navigation. On introduit une adresse de site et on termine par la touche «Retour» ou «Entrée». Le logiciel télécharge alors la page correspondante à l adresse. Les pages de l Internet constituent une nouvelle forme de texte où des liens dynamiques permettent de se déplacer d une partie de document à une autre. Ces liens dynamiques sont désignés hyper-liens ou liens hypertextes. Sur ces pages, un lien hypertexte est signalé par du texte souligné, des boutons ou des icônes. Ces liens sont des adresses URL codées sous certains mots ou certaines images. Ainsi, il est possible de naviguer d un emplacement à un autre : plus loin sur la même page, sur une autre page du même site Internet, ou encore sur un site différent. L hypertexte permet donc 6

de dépasser la linéarité des textes pour permettre des parcours individualisés. Les documents hypertextes et hypermédias a sont codés par le langage HTML b. Pour revenir sur une page déjà vue, on clique sur la fonction «Back», «Recul» ou «Précédent» du logiciel qui garde en mémoire vive les dernières pages consultées. On peut y revenir aussi par l «Historique» qui garde sur le disque dur, dans un répertoire temporaire réservé à l Internet, une copie des pages antérieurement consultées pour une durée qui varie selon l option choisie : un jour, une semaine, 20 jours I.2.4. Sauvegarde de l information Le logiciel de navigation comporte une fonction «Print» ou «Impression». Au bas du document imprimé, on peut noter l adresse URL de la page ainsi que la date et l heure. Ces informations sont importantes pour la citation du document s il y a lieu. On peut aussi, en passant par le menu «Fichier» ou «File» enregistrer le document sous format HTML ou sous format TEXT (texte brut, sans mise en page ni graphiques). On peut ne sauvegarder qu une image. Il suffit de se positionner sur l image puis de cliquer sur le bouton droit de la souris pour sélectionner l option correspondante. La sauvegarde des adresses URL des pages visités se fait par le menu «Favoris», «Signets» ou «Bookmarks». On construit ainsi progressivement une liste de repères sur l Internet. Il suffit de sélectionner une adresse pour se retrouver sur la page correspondante. Explorer sauvegarde les adresses URL sous forme de raccourcis alors que Netscape les ajoute à un fichier désigné «bookmark.htm». I.3. Droit d auteur et propriété intellectuelle Il est techniquement facile de copier une page d information présentée sur l Internet. On remarque, de plus en plus sur les sites Internet, des mentions claires de libre circulation, de modalités d utilisation ou de droits réservés. La publication commerciale de documents, sur l Internet, est actuellement freinée par le manque de contrôle des droits d auteur. L Internet étant international, le contrôle implique des ententes protectrices des droits d auteurs à l échelle mondiale. a Hypermédia : Fichier hypertexte comportant des fichiers audios et vidéos. Il faut que des logiciels adéquats soient installés sur l ordinateur de l usager pour que le contenu de ces fichiers soit déployé. b HTML (HyperText Markup Language) : Langage de codage des fichiers hypertextes et hypermédias, langage de description adopté par la communauté Internet, langage à balise, dérivé du SGML, utilisé pour coder les pages Web. 7

Les principes du droit d auteur et de la propriété intellectuelle s appliquent à l Internet et les internautes sont tenus de les respecter. Il est permis, et même recommandé, d insérer des liens hypertextes reliant son document aux autres documents accessibles sur l Internet. Il est, en revanche, nécessaire de demander la permission avant d utiliser, pour d autres fins que la consultation personnelle, un document diffusé sur l Internet. Tout extrait textuel, graphique ou sonore provenant de l Internet doit être correctement cité 6. On doit préciser les informations suivantes (tout en respectant, l ordre, l architecture et la ponctuation du modèle) : «Auteur (Organisme ou auteur personnel). (Date : jour, mois, année de la consultation par l utilisateur). Titre de la page d accueil, [type de support]. Adresse URL :» Exemple : UNIVERSITE DE LAVAL, CREPUQ, Canada. (Page consultée le 25/11/1999). Comment citer un document électronique, [en ligne]. Adresse URL : http://www.bibl.ulaval.ca/doelec/citedoce.html En résumé, si ce mémoire devait être affiché comme une page Web, il aurait été rédigé et structuré différemment. Toutes les parties citées et renvois auraient été réduits à une phrase, voire quelques mots, affichés comme liens hypertextes. C est pourquoi les pages Web sont en général beaucoup moins longues. I.4. Sécurité et confidentialité A l heure actuelle, la sécurité dans la transmission de l information sur l Internet n est pas garantie. En effet, alors que les «paquets» d informations circulent, il est toujours possible de les intercepter et de s approprier leur contenu. Ces problèmes de sécurité de l information sont particulièrement inquiétants lorsqu il s agit de transactions commerciales. Un grand effort est donc entrepris pour rendre l Internet plus sécuritaire. Il existe des logiciels qui permettent de crypter l information transmise. Un autre problème relié à la sécurité est celui des «virus informatiques». Ceux-ci peuvent certainement se propager à partir de l Internet. C est par le téléchargement de logiciels que le risque de contamination est le plus grand. Il serait sage de munir son poste de travail d un logiciel anti-virus et d en surveiller les nouvelles versions pour le tenir à jour et ce au moins une fois par semaine. 8

II. Services accessibles par l Internet II.1. Services d information ou de traitement II.1.1. Exécution à distance : Telnet, X-Window Une des fonctions importantes, à l origine de l Internet, était de permettre aux chercheurs d accéder à des ordinateurs puissants pour y effectuer des calculs sophistiqués. L exécution d un programme sur une machine distante peut être réalisée à travers deux modes d accès : Telnet a en mode alphanumérique et X-Window en mode graphique. L adresse URL pour Telnet est de la forme Telnet://hôte. Il faut disposer d un identifiant et d un mot de passe pour utiliser les ressources d une machine distante. Grâce aux navigateurs, l utilisateur peut accéder à l ordinateur distant et lui faire exécuter diverses applications. II.1.2. Transfert de fichiers : FTP et Archie L adresse URL prend la forme ftp://hôte/répertoire/sous-répertoire/fichier. Archie est une recherche de fichiers localisée sur des serveurs FTP. Ces fichiers sont le plus souvent des logiciels en accès libre. Le transfert de fichiers permet le téléchargement de tout type de fichiers entre une machine distante et une machine locale ou inversement. Il existe un grand nombre de serveurs de fichiers à accès public. La norme est de créer un compte ayant comme nom d usager «anonymous» qui ne nécessite pas de mot de passe. Si un mot de passe est demandé, il suffit d entrer son adresse de courrier électronique. Les fichiers transférés peuvent être des fichiers textes, des images ou des logiciels. Il faut noter le mode de transfert (texte ou binaire). Un logiciel particulier de décompression peut être requis pour décompresser ultérieurement le fichier de façon adéquate. Ce n est pas la fonction la plus conviviale de l Internet. Il est fortement recommandé d activer systématiquement un anti-virus avant d exécuter un fichier transféré. a Telnet : Protocole permettant l accès à des ordinateurs distants, pour leur faire exécuter diverses applications. 9

II.1.3. Accès en mode Gopher Gopher a a été créé pour faciliter la recherche et l accès à l information sur l Internet. La croissance du «Gopherespace» s est arrêtée alors que la domination du World Wide Web b s est établie. Cependant, les menus Gopher, encore disponibles, demeurent toujours une source importante d information. L adresse URL des sites Gopher est de la forme gopher://hôte/repertoires/. II.1.4. Accès en mode HTTP Le protocole HTTP c permet l échange d informations entre un logiciel client, c est-àdire le navigateur, et un serveur. L adresse URL d un serveur HTTP se présente sous la forme http://serveur-hôte/répertoire/sous-répertoire/fichier.html. C est le protocole du World Wide Web. Le Web constitue une véritable bibliothèque virtuelle composée de millions de documents d HTML. Son taux de croissance a été fulgurant depuis les dernières années et il s est vite établi comme une source d information incontournable. Une des forces du Web est qu il donne accès à un grand nombre de services de l Internet. Grâce aux logiciels de navigation, la consultation, en mode Web, est devenu le mode le plus évolué sur l Internet. Sans éliminer les protocoles qui l ont précédé, il les intègre. On peut donc naviguer en mode HTTP et rencontrer au passage des informations en mode Gopher, en mode Telnet, en mode FTP, envoyer du courrier électronique, consulter un forum sur Usenet Le logiciel de navigation déclenche au besoin les autres logiciels requis. a Gopher : Protocole permettant la recherche et l accès à l information présentée dans une structure hiérarchique ou arborescente de menus et sous-menus. b World Wide Web : Toile d araignée mondiale (Web : toile) conçue au Centre Européen de Recherche Nucléaire (CERN). On peut le désigner par WWW, W3 ou Web. Le Web est fondé sur le concept d hypermédia et la navigation entre documents rattachés par des liens hypertextes (ou hyper-liens). Les liens peuvent exister entre deux ordinateurs géographiquement distants. c HTTP (HyperText Transfer Protocol) : Protocole permettant le transfert des fichiers hypertextes et hypermédias. d Nombre de pages Web : très variable, il serait de 30, 100, 150 ou 800 millions voire 1 milliard selon la source consultée. 10

II.2. Services de communication L Internet, offre différentes formes de communication. La variété de ces formes dépend moins du matériel (hardware) que des logiciels (software). Pour changer de forme de communication, il suffit le plus souvent d activer d autres logiciels. II.2.1. Communication directe entre utilisateurs IRC sont des canaux de communication permettant d établir une conversation en temps réel avec des interlocuteurs du monde entier. Les visioconférences permettent aux interlocuteurs de se voir et de se parler à travers l Internet. Les outils collaboratifs sont de nouveaux logiciels permettent de travailler en collaboration et à distance sur l Internet. Ces derniers intègrent plusieurs fonctions : visioconférence, conversation en direct, partage d application, espace de travail commun. C est cette forme de communication qui nécessite le plus d apport supplémentaire en matériel (caméra vidéo, écran de télévision, scanner ). II.2.2. Courrier électronique Le fournisseur d accès ou autre serveur disposant de «poste électronique», délivre, à qui le demande, une adresse électronique se présentant sous la forme usager@hôte (hôte est l adresse Internet du serveur fournisseur). Le courrier électronique permet aux usagers de l Internet de s échanger des messages écrits de manière efficace et rapide. En effet, la réception des messages se fait généralement en moins d une minute après l envoi, et pratiquement n importe où dans le monde. Les termes e-mail ou «Courriel» (pour les francophones), sont utilisés pour désigner de façon succincte le courrier électronique. Il est possible d attacher un fichier à un courrier électronique. Les fichiers attachés peuvent être de tout type (fichier texte, fichier contenant du son, de l image fixe ou animée). Le Courriel est en voie de supplanter le fax car il est plus économique que ce dernier (d un facteur 10 pour des transferts interurbains et plus pour les internationaux) tout en conservant son caractère électronique. Deux protocoles sont utilisés le SMTP a et le POP b. Le courrier électronique ne bénéficie d aucune sécurité. A l émission d un message, tout le monde peut se faire passer pour tout le monde. A la transmission, un expert peut facilement intercepter le contenu. a SMTP (Simple Mail Transfer Protocol) : Protocole permettant le transfert des messages dans une boîte aux lettres, généralement situé sur une machine Unix. b POP (Post Office Protocol) : Protocole permettant le transfert des messages depuis une boîte aux lettres vers généralement un micro-ordinateur. 11

A la réception, les boîtes à lettres sont lisibles par l administrateur du système. Depuis l avènement du commerce électronique, des solutions techniques apparaissent pour assurer la sécurité des échanges via Courriel. La signature électronique peut assurer l authentification des messages. Encore fautil que sa valeur juridique soit reconnue! Le chiffrement peut empêcher l interception des messages pendant leur transmission. II.2.3. Forums et listes d envoi Les chercheurs ont toujours eu besoin d entrer en contact avec d autres spécialistes. Le courrier électronique s est vite répandu comme un moyen efficace pour établir ce contact. Cependant, il oblige à savoir, à priori, vers qui envoyer son message. C est ainsi que sont apparus les forums a électroniques. Le phénomène a vite dépassé les universitaires et tout sujet est devenu propice pour la création de groupes ou forums de discussion. Il existe ainsi plus de 20 000 forums dont plusieurs centaines dans le domaine biomédical (à l exemple du forum news:sci.med.telemedicine). On distingue deux types de forums. Le premier type de forum est en fait basé sur le courrier électronique (Listserv par exemple). Ces forums fonctionnent par la création et le maintien d une liste b d abonnés. L intéressé peut s y inscrire en envoyant un message bien défini à l adresse du forum. Une fois son adresse incluse dans la liste du groupe, tous les messages postés au forum lui seront acheminés dans sa boîte postale électronique. Certains forums ont un modérateur qui filtre les messages. Le second type de forum se nomme «Usenet». Tous les messages envoyés à un groupe de discussion d Usenet sont transmis à tous les serveurs Usenet du monde. Au lieu de s accumuler dans une boîte de courrier personnelle, les messages sont consultables sur les serveurs Usenet. Les messages y sont conservés pendant une durée variable selon la politique institutionnelle. L adresse URL d un groupe de discussion de Usenet est de la forme : news:nom_du_groupe. Certains groupes de discussion sont disponibles selon les deux formules, au choix. On peut s y abonner personnellement ou aller consulter les messages sur un serveur Usenet. a Forum : Groupes de nouvelles ou de discussion permettant d échanger des opinions sur un thème précis entre utilisateurs préalablement inscrits. b Listes d envoi : Liste permettent de distribuer des messages à différents groupes d utilisateurs qui s y sont préalablement enregistrés. 12

III. Recherche de ressources sur l'internet Lorsqu on consulte l Internet, on souhaite trouver des adresses en rapport avec un sujet donné. Cependant, on ne trouve pas tout sur l Internet. Doit-on utiliser différentes sources pour arriver à un résultat? Comment savoir si l information trouvée est bonne? N y a-t-il pas mieux ailleurs? Pour se retrouver dans les millions de pages qui constituent le Web, on a recours aux outils de recherche. Bien les utiliser implique de : Maîtriser son navigateur, allié principal dans toute opération de recherche ;. Connaître différentes catégories d outils de recherche et en manipuler un minimum dans chaque catégorie ; Interpréter rapidement certains «signes» permettant d éviter les sélections inutiles ou le recueil d informations non valides ; Construire, petit à petit, sa propre bibliothèque d URL d outils de recherche ou d orientation. III.1. Formulation des requêtes La formulation des requêtes 7, 8 varie selon les systèmes. Les possibilités d interrogation diffèrent d un outil à l autre. Sur chaque site, on peut trouver des explications, des exemples, des réponses aux questions fréquemment posées, en somme toute une variété de pages d aide pour mieux les apprivoiser. Il faut les lire avant de formuler sa question. Malheureusement, ces aides ne sont pas toujours fournies ou ne sont pas suffisamment claires. III.1.1. Phrases ou mots clés? Certains utilisateurs ont tendance à exprimer leurs requêtes comme on formule une phrase : «qu est-ce qu un nucléole» ou encore «mécanismes de l immunité». Le programme de recherche ne peut qu être troublé par ces apostrophes et ces mots supplémentaires. Il aurait mieux valu introduire : «nucléole», «mécanisme AND immunité» car le programme de recherche se base sur un système de recherche par mots clés. Le logiciel ne comprend pas une phrase mais peut se débrouiller à l aide de mots clés, d entités séparées La troncature est en général possible. L étoile «*» permet de remplacer 0 à n caractères à droite du mot. C est ainsi que «medi*» permet de collecter «medicine», «medical», «médical» mais aussi «médicament» et autres mots commençant par «medi». 13