THÈSE PRESENTEE PAR THEME



Documents pareils
Architecture des ordinateurs. Environnement Windows : sauvegarde


Date : 01/10/12 Cours SISR1 Greta Lycée La Tournelle La Garenne Colombes

Chapitre 1 : Introduction aux bases de données

Clients et agents Symantec NetBackup 7

CA ARCserve Backup. Avantages. Vue d'ensemble. Pourquoi choisir CA

Sauvegarde et archivage

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Module 0 : Présentation de Windows 2000

Distinguer entre «Enregistrer» et «Sauvegarder»

CPLN 20/08/2009 MBO Service ICT et Pédagogie

Windows Internet Name Service (WINS)

Projet : PcAnywhere et Le contrôle à distance.

CA ARCserve Backup r12

LES ACCES ODBC AVEC LE SYSTEME SAS

LA SAUVEGARDE DES DONNEES SUR LES ORDINATEURS PERSONNELS

Cours Bases de données

1. Introduction Avantages, fonctionnalités, limitations et configuration requise Avantages... 2

PARAGON SYSTEM BACKUP 2010

Sauvegarder automatiquement ses documents

Maintenance de son PC

Les bases de données Page 1 / 8

Retrospect 7.7 Addendum au Guide d'utilisation

Description du logiciel Acronis Backup & Recovery 11.5

Symantec Protection Suite Enterprise Edition Protection éprouvée pour les terminaux, la messagerie et les environnements Web

Faculté des sciences de gestion et sciences économiques BASE DE DONNEES

Formateurs : Jackie DAÖN Franck DUBOIS Médiapôle de Guyancourt

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Initiation aux bases de données (SGBD) Walter RUDAMETKIN

La sécurité informatique d'un centre d imagerie médicale Les conseils de la CNIL. Dr Hervé LECLET. Santopta

Symantec Backup Exec.cloud

THEGREENBOW FIREWALL DISTRIBUE TGB::BOB! Pro. Spécifications techniques

et Groupe Eyrolles, 2006, ISBN :

Enterprise Intégration

Sauvegarde. de données. Nos conseils de prise en main

STATISTICA Version 12 : Instructions d'installation

Bases de données Cours 1 : Généralités sur les bases de données

Guide d'intégration à ConnectWise

Restauration rapide et fiable sur des plates-formes matérielles différentes, dans des environnements virtuels ou sur des sites distants.

FileMaker 13. Guide ODBC et JDBC

Acronis Backup & Recovery 10 Advanced Server Virtual Edition. Guide de démarrage rapide

Avantages de l'archivage des s

Préparer la synchronisation d'annuaires

Programme détaillé. Administrateur de Base de Données Oracle - SQLServer - MySQL. Objectifs de la formation. Les métiers

Backup Exec 2010 vs. BackupAssist V6

Gestion des sauvegardes

PLAN. Industrialisateur Open Source LANS DE SECOURS INFORMATIQUES PRINCIPES GENERAUX ETAT DE L ART SELON BV ASSOCIATES

La maison connectée grâce au courant porteur en ligne (CPL)

PC Check & Tuning 2010 Optimisez et accélérez rapidement et simplement les performances de votre PC!

Guide de l'utilisateur

IMPLANTATION D UN SYSTÈME DE GESTION ÉLECTRONIQUE :

Guide de configuration de SQL Server pour BusinessObjects Planning

Prise en main. Norton Ghost Pour trouver des informations supplémentaires. A propos de Norton Ghost

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer

LANDPARK NETWORK IP LANDPARK NETWORK IP VOUS PERMET D'INVENTORIER FACILEMENT VOS POSTES EN RÉSEAU

Présentation. NOUVEAU Prise en charge des derniers environnements virtuels VMware ESX 3.5, Microsoft Hyper-V et Citrix XenServer 4.

Documentation utilisateur, manuel utilisateur MagicSafe Linux. Vous pouvez télécharger la dernière version de ce document à l adresse suivante :

SafeKit. Sommaire. Un livre blanc de Bull Evidian

La réplication sous SQL Server 2005

Installation de Bâtiment en version réseau

IBM CommonStore for SAP V8.4 fournit un nouveau support complet pour ILM à partir de la gestion de la rétention des données SAP

Gestion collaborative de documents

Chapitre 10. Architectures des systèmes de gestion de bases de données

Sauvegarde des bases SQL Express

FACILITER LES COMMUNICATIONS. Le gestionnaire de réseau VPN global de Saima Sistemas

Sécurité des Postes Clients

Nouvelles stratégies et technologies de sauvegarde

Sur un ordinateur exécutant Windows 2000 Server Ayant une adresse IP statique

Les sauvegardes de l ordinateur

Virtualisation de Windows dans Ubuntu Linux

Mise à jour de version

Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows W2K pro: configuration.

Les modules SI5 et PPE2

SQL Server 2014 Administration d'une base de données transactionnelle avec SQL Server Management Studio

Cyberclasse L'interface web pas à pas

«clustering» et «load balancing» avec Zope et ZEO

DOSSIER DE PRESSE. Protégez votre activité, Sauvegardez vos données

Introduction aux bases de données Cours 1 : Généralités sur les bases de données

Sauvegarder ses données avec Syncback Windows 98, 2000, Me, NT, XP

Business Intelligence avec SQL Server 2012

DOSSIER SOLUTION : CA RECOVERY MANAGEMENT

Symantec Backup Exec 12.5 for Windows Servers. Guide d'installation rapide

Cours admin 200x serveur : DNS et Netbios

laissez le service en démarrage automatique. Carte de performance WMI Manuel Désactivé Vous pouvez désactiver ce service.

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

Sync-A-BOX et Duplicati. est une plateforme Cloud pour stocker et gérer vos données en ligne.

Concepts et systèmes de stockage

Configuration de plusieurs serveurs en Load Balancing

Prérequis techniques pour l installation du logiciel Back-office de gestion commerciale WIN GSM en version ORACLE

SAUVEGARDER SES DONNEES PERSONNELLES

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

Fiche technique: Sauvegarde et restauration Symantec Backup Exec 12.5 for Windows Servers La référence en matière de protection des données Windows

But de cette présentation

Déployer des Ressources et des Applications sous Android.

GHOST SPECIAL EDITION Guide d'installation et d'utilisation

Le logiciel pour le courtier d assurances

Ordinateur central Hôte ERP Imagerie/Archivage Gestion des documents Autres applications d'administration. Messagerie électronique

SQL Server Administration d'une base de données transactionnelle avec SQL Server Management Studio (édition enrichie de vidéos)

Transcription:

République Algérienne Démocratique et Populaire MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE D ORAN ES-SENIA FACULTE DES SCIENCES DEPARTEMENT INFORMATIQUE THÈSE PRESENTEE PAR Mr Ali BELKACEMI Pour obtenir le Diplôme de Magistère Spécialité : Informatique THEME BASES DE DONNEES TITRE Vers la Réplication Universelle Date de Soutenance : 11 juin 2008 Composition du Jury : Président : Pr. D. Benhamamouch Examinateurs : Dr. S. Nait Bahloul Pr. H. Haffaf Dr. M. Ouali Directeur de Thèse : Pr. M. K. Rahmouni

REMERCIEMENTS Mes premiers remerciements vont aux membres du jury : Monsieur Benhamamouche Djillali, Professeur au département d informatique faculté des sciences Es-Sénia Oran pour l honneur qu il me fait de présider ce jury. Monsieur Haffaf Hafid, Professeur au département d informatique faculté des sciences Es-Sénia Oran d avoir bien voulu apporter son jugement sur cette thèse. Je tiens à lui exprimer toute ma gratitude pour l intérêt qu il porte à mon travail. Melle Nait Bahloul Safia, Maître de conférences au département d informatique faculté des sciences Es-Sénia Oran qui me fait honneur de juger mon travail. Monsieur Ouali Mohamed, Chargé de cours au département d informatique faculté des sciences Es-Sénia Oran, qui me fait l honneur de participer à ce jury. Je le remercie également pour l aide, les conseils et la confiance qu il m a apportés. Monsieur Rahmouni Mustapha Kamel professeur au département d informatique faculté des sciences Es-Sénia Oran, qui m a encadré. Je lui suis reconnaissant pour sa disponibilité, ses conseils et sa gentillesse dont il a fait preuve. Je ne saurai jamais lui exprimer toute ma gratitude pour avoir été mon encadreur, mais aussi une personne sur laquelle j ai toujours pu compter. Outre les membres du jury, mes remerciements vont a : Mademoiselle Bendida Nacera, pour la disponibilité et l efficacité dont elle a fait preuve. Monsieur Izza Rabah et Fatmi Mohamed pour leur soutien. Melle Zegai Imène pour sa disponibilité. Enfin, je n oublierai pas mes familles, en particulier Maman, pour s être occupée de moi et qui m a permis de conquérir le monde adulte. Ma femme et mes enfants pour l amour et la fierté qu ils éprouvent envers moi. N oubliez pas je serai toujours la pour vous.

L informatique c est génial Mais quand ça fonctionne.

Introduction Générale... 1 Chapitre I Bases de Données et SGBD I.1 Première définition de la réplication...5 I.2 Notion de Base de Données...5 I.2.1 Définitions..5 I.2.2 Analyse de la définition..6 I.2.3 Objectifs liés a la définition 6 I.3 Le Système de gestion de bases de données ou SGBD..7 I.4 Vers un SGBD Idéal...8 I.5 Conclusion...10 Chapitre II De la Sauvegarde Vers la Réplication II.1 Introduction.....12 II.2 Copie ou sauvegarde?...12 I I. 3 Finalité......13 II.4Critères de choix..13 II.5 Stratégies de sauvegarde 14 II.6 Sauvegarde sur serveur 14 II.7 Sauvegarde sur système client 15 II.8 Sauvegarde sur Internet 15 II.9 Méthodes de sauvegarde les plus courantes... 16 II.10 Mécanisme.17 II.10.1 Sauvegarde complète.17 II.10.2 Sauvegarde différentielle 17 II.10.3 Sauvegarde incrémentale..18 II.11 Pourquoi sauvegarder 18 II.11.1 Sauvegarde informatique face aux virus.18 II.11.2 Sauvegarde informatique face aux SPYWARES 19 II.11.3 Sauvegarde informatique Face aux pannes.19 II.12 Limites de la sauvegarde 20 II.13 Conclusion..21

Chapitre III : La Réplication Classique III.1 Introduction...23 III.2 Cas application n utilisant...pas de réplication.24 III.3 Cas application utilisant la réplication..25 III.4 Fonctionnalités..25 III.5 Objectifs de la réplication...25 III.6 Répliquer Quoi?...25 III.6.1 Base de données Maître «Replica maître»...26 III.6.2 Base de données Replica «Replica abonné» 26 III.7 Comment Répliquer?...26 III.7.1 réplication mono directionnelle (asymétrique)...27 III.7.2 réplication bi directionnelle (symétrique)..27 III.8 Méthodes de propagation..28 III.8.1 Mise a jour synchrone (temps réel)...28 III.8.2 La mise a jour asynchrone...28 III.8.3 Les différents types de réplication..28 III.8.3.1 Réplication asymétrique synchrone.29 III.8.3.2 Réplication symétrique synchrone..29 III.8.3.3 Réplication asymétrique asynchrone...29 III.8.3.4 Réplication symétrique asynchrone.30 III.9 Quels sont les moyens de réplications?...31 III.10 Solutions existantes.33 III.11 Limites de la réplication classique...33 III.12 Conclusion...34 Chapitre IV : Vers la réplication Universelle IV.1 Introduction...36 IV.1.1Définition 36 IV.1.2 Principe de fonctionnement...36 IV.1.3 Présentation de l UDR (Universal Data Réplication)...37 IV.1.4. UDR puissance et facilités 38 IV.1.5 l UDR : media hétérogènes, connexion hétérogènes 39 IV.2 Notion ODBC 40 IV.2.1 Inconvénients de la technologie ODBC.41 IV.2.2 Pilotes ODBC par défaut 41 IV.3 Nom des sources de données (DSN)...41 IV.4 Déclaration de la source de données.42 IV.5 Introduction OLEDB.45 IV.6 TCP/IP...45

IV.7 Accès aux bases tierces.46 IV.7.1 Accès natif..46 IV.7.2 Accès par un driver ODBC direct..46 IV.7.3 Accès ODBC via le provider OLE DB..47 IV.7.4 Accès par un provider OLE DB.47 IV.8 Comment utiliser le Driver ODBC 47 IV.9 Les journaux.48 IV.9.1 Journaux relatifs aux traitements...48 IV.9.1.1 définition..48 IV.9.1.2 contenu du journal..48 IV.9.1.3 les types de journaux..49 IV.9.2 journaux propres a la réplication 50 IV.10 Contraintes pour réussir la réplication.50 IV.11 Notion de déclencheurs (triggers).. 51 IV.1.2 Définition...51 IV.1.3 Intérêts des triggers 52 IV.1.4 Manipulation des triggers...52 IV.1.4.1 Procédure associée...52 Chapitre V : Solution technique V.1 Introduction....54 V.2 Présentation de la solution.55 V.2.1 Principe de fonctionnement.56 V.2.2 Cycle de vie..57 V.3 Plateformes de développement..58 V.4 Enchaînement des traitements..58 V.4.1 PHASE : Description générale...59 V.4.2 PHASE : Description utilisateur...62 V.4.3 PHASE : Génération..63 V.5 L Edition d une réplication...67 V.6 Sauvegarder...67 V.7 Suppression de projet...67 V.8 Mise à niveau...67 V.9 Description de l analyse 68 V.9.1 Dictionnaire des rubriques.68 V.9.2 Liste des fichiers 68 V.10 Traitement associé à la réplication 75 V.10.1 Traitement Trigger avant 75 V.10.2 Traitement Trigger après 76

Conclusion Générale 80 Glossaire...82 Bibliographie..90

1ntroduction Générale Vers la Réplication Universelle Le monde évolue, la technologie évolue. Le marché des systèmes de gestion des bases de données ne cesse de s enrichir (ORACLE, MYSQL, DB2, INFORMIX, INGRES.) Les systèmes d exploitation (dos, win30 windows95, vista, Linux.) Les réseaux ne font pas exception (local, intranet, Internet) Les media aussi (disquette, lecteur zip, CD, DVD, clé USB) Aujourd'hui, les bases de données sont de plus en plus utilisées au fur et à mesure que le monde informatique se développe et que les flux de données augmentent sur Internet. Ainsi, il y a un plus gros besoin de transférer des données entre bases de données. La synchronisation est une solution efficace à ces problématiques. Elle est particulièrement utile dans des situations telles que la sauvegarde de données, synchroniser des bases de données qui ont été modifiées sur différents serveurs, ou encore envoyer à un utilisateur seulement les données dont il a besoin. Problématique De nombreux outils de synchronisation sont déjà fournis par des serveurs de base de données tels que Microsoft SQL Server et Oracle. Ce sont des solutions performantes et intégrées mais elles ne fonctionnent qu'à l'intérieur de leur propre système. Le besoin des entreprises de communiquer à l'extérieur de leur structure (avec des clients et des fournisseurs par exemple) amène à synchroniser des données entre bases de données de différentes organisations et qui peuvent donc être hétérogènes (SGBD). Il est évident qu il n existe pas actuellement d outils universels permettant de synchroniser les données entre plusieurs bases de données évoluant dans divers SGBD. Cette thèse s attaque à l analyse, la conceptualisation et la mise en uvre d une technique de réplication originale permettant de faire communiquer plusieurs SGBD, sites, média, types de réseaux et systèmes d exploitation. Cette technique permet de rendre transparent toutes les interactions entre les sites, média, types de réseaux et systèmes d exploitation [CHA84]. Il devient désormais suffisant pour le concepteur de connaître un SGBD, un système d exploitation pour pouvoir communiquer avec d autres SGBD. Éléments de réponse La première idée qui nous est venue à l esprit c est de passer par un format intermédiaire universel tel que XML, Excel, etc. Dans ce cas, la base de données d origine est importée sous le format universel, traitée, puis reconvertie dans son format d origine. Cependant, nous avons vite abandonné cette idée car elle présente plusieurs inconvénients, entre autres, elle ne permet que la réplication asynchrone, et le temps de transformation est considérable, posant un problème de performance. 1

1ntroduction Générale Vers la Réplication Universelle Dans le but de surmonter les difficultés posées par notre objectif de réplication multi SGBD, multi systèmes d exploitation, multi supports, multi sites, tout en gardant un niveau de performance acceptable, nous suggérons de mettre au point un système utilisant les technologies existantes. Ce système ne peut se réaliser que par l intermédiaire de deux modules différents : L interface d'administration est un programme qui permet de configurer et de gérer efficacement un nombre infini de réplications. Il donne la possibilité, pour chacune d'entre elles, de définir quelles bases de données sont concernées, quelles données doivent être répliquées et enfin quand et à quelle fréquence la tâche doit être effectuée [GRA07, SSP06]. Le serveur de réplication est en fait un programme tournant en permanence. Il récupère le planning de réplications depuis l'interface puis initie par luimême l'exécution des tâches en fonction de ce planning. Vu la difficulté du projet, on se limitera au développement de la première partie, puis on donnera une idée sur la deuxième partie. Cette thèse est organisée de la façon suivante : le chapitre I traite des notions de bases de données et des systèmes de gestion de bases de données (SGBD) ; il permet de situer les bases de données par rapport aux SGBD et montre les principales fonctionnalités d un SGBD puis met en relief les principaux critères de choix d un SGBD ; le chapitre II permet de mieux situer la copie par rapport à la sauvegarde et la sauvegarde par rapport à la réplication ; il fait aussi ressortir le caractère sécuritaire de la sauvegarde et, par conséquent, de la réplication ; des éléments de synthèse sont présentés à la fin du chapitre montrant les avantages de la réplication par rapport à la sauvegarde ; le chapitre III présente les méthodes de réplication qualifiées de classiques tout en introduisant le langage propre à la réplication (réplica maître, réplica abonné, bidirectionnelle, monodirectionnelle, synchrone, asynchrone) ; les discussions à la fin du chapitre montrent la limite de la réplication classique et ouvrent les perspectives de la réplication universelle ; 2

1ntroduction Générale Vers la Réplication Universelle le chapitre IV présente l UDR (Universal Data Replication) comme solution à la réplication universelle ; il définit le contexte de l universalité considéré (SGBD, supports, systèmes d exploitation, modes d accès) ; par ailleurs, il met en relief un réplica maître évoluant dans un SGBD «x» par rapport aux réplicas abonnés chacun défini dans un SGBD différent ; une solution globale de la réplication universelle est présentée permettant l automatisation des procédures de la mise en uvre et la mise en place de la réplication UDR ; le chapitre V présente la solution technique de la réplication universelle UDR tout en pensant à une extension vers l UDR+, qui poursuit l ouverture du serveur de réplication par rapport à plusieurs bases de données ; une conclusion générale synthétise les travaux présentés dans cette thèse et ouvre d autres perspectives (vers la réplication «update»). 3

Bases de Données et Systèmes de Gestion de Bases de Données

Chapitre 1 Bases de données et SGBD I.1 Première définition de la réplication (dictionnaire phpmyvisites) La réplication désigne le procédé par lequel on produit une copie d une base de données dans une autre base de données. Par conséquent elle a tendance à améliorer la tolérance aux pannes [BHG87, HT94, SCH90]. Cette première définition met en évidence trois mots clés : base de données, copie et tolérance aux pannes (sécurité informatique) ; il est important pour nous d en tenir compte [GHO96]. I.2 Notion de Base de Données Qu est ce qu un système de gestion de base de données? [CHA01] Avant de répondre à la question, il paraît important savoir ce qu est une base de données. qu est ce qu une base de données? I.2.1 Définitions En effet dans différents ouvrages on retrouve différentes définitions d une base de données. Parmi ces définitions, nous avons retenu celles qui sont les plus explicites [TOM85]. * «une base de données est une collection de données opérationnelles liées par des relations» * «une base de données est une collection de données en relation mutuelle sans redondance nuisible ou inutile, pour être utilisées dans de multiples applications ; les données sont enregistrées de telle sorte qu elles soient indépendantes des programmes qui les utilisent ; une approche commune et contrôlée est utilisée pour ajouter de nouvelles données et modifier ou retrouver des données existantes dans la base de données.les données sont structurées pour servir de base de développement de futures applications.un système est dit contenir une collection de bases de données si cellesci ont leurs structures complètement séparées. * «une base de données informatique est un ensemble de fichiers informatiques sur lequel sont basées toutes les activités d une organisation et dans lequel est placée une grande confiance sur la disponibilité et l exactitude». 5

Chapitre 1 Bases de données et SGBD * «dans une organisation une base de données est essentiellement un outil communautaire. Contrairement à l approche traditionnelle ou chaque application crée ses propres fichiers et vit de manière relativement isolée, l approche base de données consiste à définir pour un ensemble d applications ayant un univers de référence commun, une structure susceptible d optimiser de manière globale le système d information». I.2.2 Analyse de la définition Une base de données est donc un ensemble, au sens mathématique, de données. Physiquement, cet ensemble de données a la forme d une collection d informations [KP97]. Ces informations seront enregistrées sur des supports informatiques. Les méthodes de codages des informations, ainsi que les méthodes d écriture et de mise à disposition de ces informations ne nous préoccuperont pas dans leur aspect physique. Seul compte le fait que nous associons au concept de base de données l idée d une collection de données disponible, accessible et extensible. Cet ensemble de données est structuré. Cela signifie que la collection est organisée. Il existe donc des liens entre les différents éléments. Il est important de noter que ces relations entre les diverses informations sont autant d informations supplémentaires. Une base de données est donc plus riche qu une accumulation d informations, car toute information s y enrichit des liens qu elle a avec les autres. Ces liens permettent d accéder plus rapidement et plus facilement à une information à partir d une autre. Donc les bases de données tirent leur richesse des interrelations entre les informations qu elles contiennent. Une base de données aura donc plus d intérêt de regrouper des données ayant un dénominateur commun. Cet élément commun est l application pour laquelle est construite la base de données. Le terme application inclut généralement le développement des traitements. Une même donnée pourra donc être utilisée différemment par plusieurs traitements. Une base de données unique, regroupant l ensemble des données, mettra donc à disposition l ensemble des informations nécessaires à tous les traitements requis par l application. Pour construire une base de données il est nécessaire de répondre aux questions suivantes : quelles peuvent être ces données? quels seront les liens qui les uniront? quels seront les traitements qui les utiliseront? 6

Chapitre 1 Bases de données et SGBD I.2.3 Objectifs liés a la définition. Une base de données : 1. doit pouvoir être utilisée en mode interactif et en mode batch 2. doit permettre l indépendance des données et des traitements 3. doit permettre tout accès prévu à une donnée. 4. doit permettre le contrôle des accès aux données. 5. n est pas figée mais évolutive. Cet ensemble peut être restructuré. I.3 Le Système de gestion de bases de données ou SGBD fourni avec le LDD (Langage de description de données) et le LMD (langage de manipulation de données) Un SGBD peut être vu comme un ensemble d utilitaire permettant d effectuer les opérations décrites précédemment. Ces opérations peuvent être regroupées à travers une explication du verbe gérer [KP97]. Gérer = Construire+Utiliser+Maintenir+Réorganiser. 1. Construire (LDD) Le SGBD doit offrir les moyens de créer la base de donnés. Le SGBD doit fournir les moyens pour pouvoir implanter physiquement les données (partie physique) et décrire les liens qui les unissent (partie logique). 2. Utiliser (LMD) La finalité d une base de données est de mettre à disposition des informations. Les données devront être accessible en mode interactif ou en mode batch. Par conséquent : Le SGBD doit fournir les outils de consultation et de mise à jour. Le SGBD doit assurer les fonctions de contrôle de données et contrôles des accès concurrents. 7

Chapitre 1 Bases de données et SGBD 3. Maintenir (utilitaires) La crédibilité d une base de données repose sur sa cohérence. Le SGBD aura donc pour fonction de maintenir la base dans un état cohérent et, à défaut, offrir les moyens de générer la base à partir d une sauvegarde. 4. Réorganiser (LDD) Réorganiser signifie remettre en question, au moins modifier ce qui a été construit. Le SGBD doit donner les moyens de réorganiser physiquement, logiquement les données. I.4 Vers un SGBD Idéal Vu la concurrence des SGBD existant dans le marché, un choix s impose, nous nous contentons d énumérer les points déterminants : Critères pouvant participer à l'évaluation d'un SGBD [TRI93] - gestion de l espace disque - gestion des clés primaires et secondaires - gestion des liaisons inter fichiers - gestion du dictionnaire de données - restructuration des données et optimisation - journalisation et reprise des incidents - portabilité des programmes et fichiers d une version à l autre Le système induit une certaine centralisation (une seule et même base pour tout le monde); on peut donc réduire les redondances, et veiller à leur cohérence (une mise à jour est faite pour tout le monde et non pas uniquement pour celui qui en est à l'origine). le système supporte au moins un modèle (abstrait) de données ; indépendance physique: le stockage physique des données dépend uniquement du site sur lequel elles sont implantées et tient compte des critères de performances [CT92, ACL87, JA91], facilités d'accès, encombrement des volumes... indépendance logique: les données manipulées modélisent une certaine réalité perçue de façon différente suivant les utilisateurs; ainsi chacun doit pouvoir appréhender sa propre vision du réel au travers de la base (ne voir qu'une partie des données, les associer de manière différente...); 8

Chapitre 1 Bases de données et SGBD Environnement de développement non procédural: l'utilisateur doit spécifier ce qu'il désire extraire de la base et non comment l'extraire (QUOI et non COMMENT); les applications sont indépendantes des chemins d'accès. La complexité des systèmes sous-jacents impose pratiquement un langage de requêtes; c'est donc au système d'effectuer la conversion et d'optimiser la procédure interne de réponse à la requête); ces indépendances facilitent l'évolutivité des applications; Convivialité permettant la manipulation de la base pour des utilisateurs banalisés en particulier non informaticiens; Les garanties au niveau de la sécurité et de l'intégrité des données sont prises en charge automatiquement: les accès sont restrictifs (tout le monde n'a pas accès à tout), différents niveaux d'autorisation sont possibles (d'où confidentialité); les données entrées dans la base passent par un crible qui en assure l'intégrité; Gestion des accès concurrents, notion de transaction; partageabilité: utilisation transactionnelle en temps réel dans un environnement multiutilisateurs; ces possibilités ont à la base de certains types d'applications dans le domaine de la banque, de systèmes de réservations... Sécurité contre les destructions: journalisation, sauvegarde, reprise après panne; Standardisation des systèmes permettant une portabilité maximale des données et des applications; Administration: seul l administrateur (*) a tous les droits sur la base: il l'a créée, suit son évolution, gère les sauvegardes, ajuste les paramètres du système, accorde les droits d'accès, résoud les conflits ; il est le responsable de l'efficacité des accès et de la sécurité des données. (*) L administrateur de la base étant la personne ou le groupe de personnes qui ont la responsabilité du contrôle général du SGBD. 9

Chapitre 1 Bases de données et SGBD I.5 Conclusion En résumé nous dirons que : Une base de données est un ensemble structuré de données. Le SGBD est un logiciel permettant la gestion de la base de données. Pour conclure ce chapitre, nous dirons que si la base de données est importante, sa sécurité l est encore plus. La sécurité étant un domaine tellement vaste que nous nous limiterons à l étude de la sauvegarde. Le chapitre suivant lui sera réservé. 10

De la sauvegarde vers la réplication

Chapitre II De la sauvegarde vers la réplication II.1 Introduction La sécurité informatique est l'ensemble des techniques qui assurent que les ressources du système d'information (matérielles ou logicielles) d'une organisation sont utilisées uniquement dans le cadre où il est prévu qu'elles le soient. Une perte de données accidentelle, un sinistre, ou une attaque virale, peuvent conduire à la perte de données, et par conséquent nuire au système. C est à ce moment là que le système devient vulnérable. Il est donc nécessaire de prévoir des mécanismes de sauvegarde (backup 1 ), idéalement sur des sites distants pour garantir la pérennité des données. II.2 Copie ou sauvegarde? - Copier (Dupliquer) : permet de reproduire fidèlement une source de données (Enregistrement, Fichier, ) Action Copier sauvegarder Nbre Enregistrement N N Nbre Fichier N N Type (Donnée, Multimédia) Quelconque Quelconque Support Quelconque Quelconque Durée de Vie Instantanée Selon Méthode (*) Utilisée (*) Voir Chapitre Sauvegarde 1 Mot anglais : consiste à copier des fichiers sur un support. 12

Chapitre II De la sauvegarde vers la réplication La Sauvegarde est une action qui permet de pérenniser la copie Généralement on parle de sauvegarde lorsque la copie est effectuée dans un but sécuritaire. II.3 Finalité [CCM] Les copies de sûreté sont utiles principalement à deux choses : La première et la plus évidente est de permettre de restaurer un système informatique dans un état de fonctionnement suite à un incident (perte d'un support de stockage tel que disque dur, bande magnétique, etc., ou de tout ou partie des données qu'il contient). La seconde, incluse dans la première mais certainement la plus courante, est de faciliter la restauration d'une partie d'un système informatique (un fichier, un groupe de fichiers, un système d'exploitation, une donnée dans un fichier, etc.) suite à une suppression accidentelle ou à une modification non désirée. La technique la plus fréquente est la recopie des données sur un support indépendant du système initial (ordinateur local, serveur, etc.). L'opération inverse qui consiste à réutiliser des données sauvegardées s'appelle une restauration. On parle de «stockage» pour les données sauvegardées en attente d'une éventuelle restauration. II.4 Critères de choix Le choix d'une technique de sauvegarde se fera en prenant en compte : la capacité de stockage du support (le volume d'information) la vitesse de sauvegarde, la fiabilité du support (notamment après une longue période de stockage), la simplicité de classement, la facilité à restaurer les données, 13

Chapitre II De la sauvegarde vers la réplication et bien sûr le coût de l'ensemble. Intervient également la possibilité de sélectionner les données à sauvegarder. Enfin pour les grands systèmes de sauvegarde, il faut tenir compte de critères physiques : volume physique des supports de stockage, poids, sensibilité à la température, à l'humidité, à la poussière, à la lumière. II.5 Stratégies de sauvegarde On distingue la sauvegarde d'un poste individuel et la sauvegarde sur serveur. L'une et l'autre s'adressent à la même nature d'information (la donnée informatique) et ont le même objectif (protéger l'information et permettre de la retrouver si elle était perdue), mais les méthodes de sauvegarde sont différentes pour plusieurs raisons : les données sur poste client sont réputées moins importantes que les données gérées sur des systèmes centraux ; les utilisateurs sont moins sensibilisés au risque de perte de données que les professionnels de l'informatique ; ils ont également moins de formation sur les techniques de sauvegarde ; les moyens techniques sont moins développés sur poste individuel que sur serveur, même si des progrès importants ont été réalisés ces dernières années (chute du rapport coût/volume des supports de sauvegarde, simplification des interfaces de sauvegarde, sauvegarde sans intervention de l'utilisateur, etc.) De fait, la sauvegarde des données des postes individuels reste marginale dans la stratégie d'utilisation des ordinateurs. Cependant, les entreprises, en généralisant l'usage des micro-ordinateurs et du partage des ressources en réseau, ont ressenti un besoin de sécurité qui a favorisé le développement d'outils de sauvegarde sur microordinateurs, lesquels gagnent petit à petit le monde de la micro-informatique personnelle. II.6 Sauvegarde sur serveur La sauvegarde s'inscrit dans une démarche plus globale qui consiste à assurer la continuité d'activité d'un système informatique ou, en cas de défaillance, son redémarrage le plus vite possible. Cette démarche est souvent formalisée dans un document qui peut porter des noms divers, par exemple le "PRA" (plan de reprise d'activité) ou le "PS" (plan de secours), et qui fait appel soit à des automatismes (ex. donner l'alerte en cas de coupure de courant ou de perte d'accès à une unité de stockage) soit à des gestes manuels (ex. remplacer des bandes magnétiques défectueuses). La tendance est à l'automatisation, réputée plus sûre dans les situations d'urgence que les opérations manuelles. 14

Chapitre II De la sauvegarde vers la réplication En terme de support, les serveurs ont depuis toujours requis des supports à grande capacité de stockage. La bande magnétique a longtemps été le principal vecteur, du fait de sa grande capacité, de son coût faible (par rapport aux autres supports), de sa capacité de réutilisation et de sa relative stabilité au temps et à l'usure. Puis sont venus les cartouches numériques (bandes magnétiques intégrées dans un boîtier plastique) les disques durs et plus récemment les médias optiques, réinscriptibles ou non, tels que les CD-R, DVD-R ou formats similaires. II.7 Sauvegarde sur système client Au cours des années 1975 95, la plupart des utilisateurs d'ordinateurs personnels (PC) associaient principalement le terme "backup" au fait de faire des copies sur disquettes. Avec le développement de micro-ordinateurs mieux équipés, les utilisateurs personnels ont adopté des supports plus performants : disques optiques (CD-ROM ou DVD), Clés USB. De même, les ordinateurs intègrent des fonctions de sauvegarde de plus en plus évoluées, par exemple : des outils intégrés au système d'exploitation tels que les "points de restauration" que l'on peut exécuter avant d'installer un nouveau logiciel et qui remettront le système en l'état d'avant l'installation si l'utilisateur le demande ; des logiciels capables de faire une image parfaite du système à un moment donné (image appelée un "ghost", mot qui signifie "fantôme" en anglais) ; cette image sera stockée sur l'ordinateur lui-même ou sur un support externe. II.8 Sauvegarde sur Internet Aujourd'hui, les copies de sûreté dites "en ligne" deviennent populaires et, avec la banalisation des connexions Internet à large bande et à haut débit, de plus en plus d utilisateurs recourent à ce type de service de sauvegarde. Elles consistent à se connecter à un site Internet, appelé "hébergeur", et à y transférer ses données. Les avantages sont multiples : minimiser le risque de perte puisque le site est géré par un professionnel qui fait lui-même des sauvegardes ; 15

Chapitre II De la sauvegarde vers la réplication accéder à ses données à partir de n'importe quel ordinateur connecté à Internet ; souvent le coût de cette prestation est modique, parfois même gratuit pour les petites sauvegardes. L'inconvénient majeur est de laisser ses données à disposition d'un tiers qui peut à loisir les consulter, les modifier, les dupliquer, les publier ou en faire commerce ; et même les rendre indisponibles (cas des faillites, rachats de sites par des concurrents, ou différend commercial avec l'hébergeur). Évidemment, des dispositions contractuelles viennent réguler ces risques mais elles ne peuvent empêcher l'hébergeur d'agir techniquement de façon malveillante. Une des parades à la consultation abusive consiste à chiffrer/crypter les données. Un autre inconvénient vient des limites imposées sur le stockage ou la récupération des données : pour maîtriser l'usage de ses disques et de sa bande passante, un hébergeur peut limiter contractuellement son client à un volume de stockage ou de données consultées au-delà duquel il bloque l'accès aux données. II.9 Méthodes de sauvegarde les plus courantes La méthode la plus simple est la sauvegarde complète ou totale (appelée aussi "full backup") ; elle consiste à copier toutes les données à sauvegarder que celles-ci soient récentes, anciennes, modifiées ou non. Cette méthode est aussi la plus fiable mais elle est longue et très coûteuse en terme d'espace disque, ce qui empêche de l'utiliser en pratique pour toutes les sauvegardes à effectuer. Afin de gagner en rapidité et en temps de sauvegarde, il existe des méthodes qui procèdent à la sauvegarde des seules données modifiées et/ou ajoutées entre deux sauvegardes totales. On en recense deux : La sauvegarde différentielle La sauvegarde incrémentielle La restauration d'un disque avec l'une de ces méthodes s'avère plus longue et plus fastidieuse puisqu'en plus de la restauration de la sauvegarde différentielle ou des sauvegardes incrémentielles, on doit également restaurer la dernière sauvegarde complète. Les fichiers supprimés entre temps seront également restaurés. Afin de comprendre la différence entre les deux méthodes, nous prendrons l'exemple d'un plan de sauvegarde selon le cycle suivant : Une sauvegarde complète au jour J 16