Sauvegarde collaborative en pair-à-pair



Documents pareils
Pair-à-Pair: Architectures et Services

Perspective : la sauvegarde croisée

Placez vous au préalable à l endroit voulu dans l arborescence avant de cliquer sur l icône Nouveau Répertoire

Hébergement MMI SEMESTRE 4

Cloud computing Votre informatique à la demande

TICE présentation de quelques outils. Planifier une réunion - Partager un agenda Partager des documents Des outils académiques

Programmation parallèle et distribuée

Programmation parallèle et distribuée

Sauvegarde et archivage

Sommaire. 3. Les grands principes de GFS L architecture L accès de fichier en lecture L accès de fichier en écriture Bilan

SOLUTION DE BACKUP NETISSIME DATACENTER CLOUD CONSULTING TELECOM - FORMATION

Le Cloud Computing. Stockez et accédez à tous vos documents et données depuis n importe où. Mai 2014

DOSSIER SOLUTION : CA ARCserve r16. Recours au Cloud pour la continuité d'activité et la reprise après sinistre

Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS

Symantec Backup Exec.cloud

CNAM Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

samedi 27 novembre 2010 Définition / Pourquoi? - Choisir ce qui me convient - Supports de sauvegarde - Time machine - time capsule - cloner -

Entrez dans l ère du Numérique Très Haut Débit

N e t E x p l o r e r B a c k u p. w w w. n e t e x p l o r e r. f r. c o n t a c n e t e x p l o r e r. f r

Technologie de déduplication de Barracuda Backup. Livre blanc

Le contrat Cloud : plus simple et plus dangereux

Unitt Zero Data Loss Service (ZDLS) La meilleure arme contre la perte de données

Maintenance de son PC

Nos solutions Cloud Kain, le 27 mars 2013 Laurent Guelton, Administrateur Délégué. Copyright 2013 Orditech. Tous droits réservés. Version 2.

Immobilier de prestige, biens d exception, Tour d horizon. de stockage 48 // 49

Mes documents Sauvegardés

Le Cloud. Généralités & Sécurité. Valentin Lecerf Salon du multimédia et de la photo Proville

100% Swiss Cloud Computing

Bases de données documentaires et distribuées Cours NFE04

NAS 254 Sauvegarde cloud

LES OFFRES DE NOTRE DATA CENTER

Etude des outils du Cloud Computing

Edition de février Numéro 1. Virtualisation du Poste de Travail

Steganos présente Security Suite 2007, son incontournable suite de sécurité pour PC.

DES SAUVEGARDES ET DES RESTAURATIONS DE DONNEES SANS CONTRAINTES DE LIEU NI DE TEMPS

neobe Backup Tel service de télésauvegarde informatique LE PARTENAIRE SECURITE DE VOTRE ENTREPRISE

FAQ sur le Service courriel d affaires TELUS

Pourquoi OneSolutions a choisi SyselCloud


Be-backup. Présentation de la solution Fonctionnement de Be-backup Détails techniques Notre offre Votre Retour sur Investissement

2 disques en Raid 0,5 ou 10 SAS

L ABC du Cloud Computing

Systèmes et algorithmes répartis

Continuité. Management de la. d activité. Assurer la pérennité de l, entreprise : planification, choix techniques et mise en œuvre 2 e édition

Backup. Solution de sauvegarde en ligne pour les professionnels LE PARTENAIRE SECURITE DE VOTRE ENTREPRISE!

La sécurité dans les grilles

Qu est-ce que le «cloud computing»?

Capacité de mémoire Tablettes

Gestion des sauvegardes

FAMILLE EMC RECOVERPOINT

Sauvegarde et protection des documents

Introduction aux applications réparties

Culture numérique Cloud computing

EMC AVAMAR. Logiciel et système de sauvegarde avec déduplication

Solution de sauvegarde pour flotte nomade

Problématiques de stockage d un Data Center

CA ARCserve Backup Option NAS (Network Attached Storage) NDMP (Network Data Management Protocol)

Sauvegarder automatiquement ses documents

CA ARCserve Backup. Avantages. Vue d'ensemble. Pourquoi choisir CA

arcserve r16.5 Protection des données hybride

Tableau Online Sécurité dans le cloud

CATALOGUE DES OFFRES

Système de stockage IBM XIV Storage System Description technique

Solution de stockage et archivage de grands volumes de données fichiers.

Les Content Delivery Network (CDN)

ESPACE MULTIMEDIA DU CANTON DE ROCHESERVIERE

«JE CREE EN RHÔNE-ALPES : Les outils numériques réveillent la création d entreprises!»

Veille Technologique. Cloud Computing

Analyse Concurrentielle Retrospect et ses concurrents

OCLOUD BACKUP GUIDE DE REFERENCE POUR ANDROID

Sauvegarde des fichiers

SQL Server 2008 solutions de sauvegarde et de continuité

Sommaire. Le marché du cloud avec un focus sur la France. Les conséquences de l adoption du cloud

Qu est ce qu une offre de Cloud?

La tête dans les nuages

Concours interne d ingénieur des systèmes d information et de communication. «Session 2010» Meilleure copie "étude de cas architecture et systèmes"

OCLOUD BACKUP MINI GUIDE. 1 Ocloud Backup/Mini- Guide

SERVICES INFORMATIQUES POUR PME DÉVELOPPEMENT D APPLICATIONS SUR MESURE

WHITE PAPER. Quels avantages la déduplication offre-t-elle aux entreprises? Livre blanc Acronis

GLOSSAIRE DU SOUTIEN EN CAS DE RECOURS EN JUSTICE

Concepts et systèmes de stockage

Sauvegarde en ligne sécurisée SRXBackup 100 % Automatique. Disponible 24/7. Cryptage 256 bits.

Bonjour. Yohan PARENT, Cyprien FORTINA, Maxime LEMAUX, Hyacinthe CARTIAUX

INTERNET ET RÉSEAU D ENTREPRISE

La sécurité informatique d'un centre d imagerie médicale Les conseils de la CNIL. Dr Hervé LECLET. Santopta

Mise à niveau du système informatique communal

Guide pour bien débuter avec

Protection des données avec les solutions de stockage NETGEAR

Analyse Concurrentielle Retrospect et ses concurrents

Charte d'utilisation des infrastructures de la plate-forme bioinformatique Genotoul

Vos données : Un capital à valoriser. ADD S.A. Chemin des Chalets 1279 CHAVANNES-DE-BOGIS

Configuration requise

Comment protéger ses systèmes d'information légalement et à moindre coût?

Pôle 3 : Mon cabinet, une entreprise performante

Kick Off SCC 2015 Stockage Objet. Vers de nouveaux horizons

Qlik Sense Desktop. Qlik Sense Copyright QlikTech International AB. Tous droits réservés.

DAVION Didier 33 avenue Paul Cézanne HOUPLINES. Auditeur n NPC URBANISATION ET ARCHITECTURE DES SYSTEMES D INFORMATION DOSSIER SSO

Questions et réponses

Transcription:

Sauvegarde collaborative en pair-à-pair Fabrice Le Fessant Fabrice.Le_Fessant@inria.fr ASAP Team INRIA Saclay Île de France Octobre 2008 Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 1 / 21

Plan 1 Introduction Définition Pourquoi la sauvegarde collaborative? Les atouts de la sauvegarde collaborative Les alternatives P2P versus Cloud Computing 2 Fonctionnement Vue d ensemble Confidentialité des données Réplication versus Codes Correcteurs Maintenance des données 3 Simulations de faisabilité 4 Conclusion Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 2 / 21

Plan 1 Introduction Définition Pourquoi la sauvegarde collaborative? Les atouts de la sauvegarde collaborative Les alternatives P2P versus Cloud Computing 2 Fonctionnement Vue d ensemble Confidentialité des données Réplication versus Codes Correcteurs Maintenance des données 3 Simulations de faisabilité 4 Conclusion Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 3 / 21

Définition La sauvegarde collaborative ou backup en pair-à-pair Utiliser l espace disque libre sur d autres ordinateurs connectés au réseau pour sauvegarder ses propres données. Trois contextes aux difficultés croissantes : Sauvegarder l ordinateur de mes parents sur mes ordinateurs Sauvegarder les données de l entreprise sur son réseau interne Sauvegarder mes données sur Internet Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 4 / 21

Définition La sauvegarde collaborative ou backup en pair-à-pair Utiliser l espace disque libre sur d autres ordinateurs connectés au réseau pour sauvegarder ses propres données. Trois contextes aux difficultés croissantes : Sauvegarder l ordinateur de mes parents sur mes ordinateurs Sauvegarder les données de l entreprise sur son réseau interne Sauvegarder mes données sur Internet Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 4 / 21

L utilité de la sauvegarde collaborative De plus en plus de données numériques non protégées Particuliers : couriels, contenus générés (photos, films, blogs) Professionnels : utilisation des portables pour la mobilité De plus en plus d espace disque connecté : Prolifération des connexions haut-débit : ADSL, fibre, 3G,... Augmentation de la capacité des disques : 3 Go en 1995, 160 Go en 2000, 1 To en 2008. Idem pour les portables. Et l espace libre : 1% de 1To = 10Go = 5000 photos. Les technologies sont au rendez-vous : Cryptographie : chiffrement des données, codes correcteurs, challenges de possession Pair-à-pair : organisation automatique du réseau, bande passante Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 5 / 21

L utilité de la sauvegarde collaborative De plus en plus de données numériques non protégées Particuliers : couriels, contenus générés (photos, films, blogs) Professionnels : utilisation des portables pour la mobilité De plus en plus d espace disque connecté : Prolifération des connexions haut-débit : ADSL, fibre, 3G,... Augmentation de la capacité des disques : 3 Go en 1995, 160 Go en 2000, 1 To en 2008. Idem pour les portables. Et l espace libre : 1% de 1To = 10Go = 5000 photos. Les technologies sont au rendez-vous : Cryptographie : chiffrement des données, codes correcteurs, challenges de possession Pair-à-pair : organisation automatique du réseau, bande passante Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 5 / 21

L utilité de la sauvegarde collaborative De plus en plus de données numériques non protégées Particuliers : couriels, contenus générés (photos, films, blogs) Professionnels : utilisation des portables pour la mobilité De plus en plus d espace disque connecté : Prolifération des connexions haut-débit : ADSL, fibre, 3G,... Augmentation de la capacité des disques : 3 Go en 1995, 160 Go en 2000, 1 To en 2008. Idem pour les portables. Et l espace libre : 1% de 1To = 10Go = 5000 photos. Les technologies sont au rendez-vous : Cryptographie : chiffrement des données, codes correcteurs, challenges de possession Pair-à-pair : organisation automatique du réseau, bande passante Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 5 / 21

Les atouts de la sauvegarde collaborative De nombreux avantages Facilité : pas de matériel particulier, configuration rudimentaire Rapididté : sauvegarde et restauration dès qu on est connecté Confidentialité : chiffrement des données Résistance : le système se surveille et se corrige automatiquement Distance : une catastrophe locale ne met pas en danger les données Un inconvénient : Pas de garantie de récupération des données en complément d autres techniques de sauvegarde... Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 6 / 21

Les alternatives Pourquoi une sauvegarde? 60 % des utilisateurs n ont pas de sauvegarde 60 % des compagnies qui perdent leur données font faillite dans les 6 mois Les autres sauvegardes Sur support passif (bandes, disques) : compliqué, vieillissement Sur support actif (disque externe) : compliqué, panne, vol, incendie Sur support distant (serveurs distants) : faillites, sécurité, bugs Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 7 / 21

Les alternatives Pourquoi une sauvegarde? 60 % des utilisateurs n ont pas de sauvegarde 60 % des compagnies qui perdent leur données font faillite dans les 6 mois Les autres sauvegardes Sur support passif (bandes, disques) : compliqué, vieillissement Sur support actif (disque externe) : compliqué, panne, vol, incendie Sur support distant (serveurs distants) : faillites, sécurité, bugs Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 7 / 21

Peer-to-Peer versus Cloud Computing Deux approches opposées Cloud Computing : un service (payant) qui croît et décroît en fonction des besoins de ses utilisateurs (data-center) Peer-to-Peer : un service (gratuit) constitué des ressources fournies par ses utilisateurs Le Cloud Computing va-t-il tout résoudre? Amazon, Google, Flickr, Facebook ont des centaines de millions d utilisateurs Mais : Logiciel Propriétaire -> Logiciel Libre -> Stockage Propriétaire Pas d intéropérabilité (kidnapping des données), dispersion des données, pas de confidentialité (vie privée), boîtes noires (sécurité, autres services) Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 8 / 21

Peer-to-Peer versus Cloud Computing Deux approches opposées Cloud Computing : un service (payant) qui croît et décroît en fonction des besoins de ses utilisateurs (data-center) Peer-to-Peer : un service (gratuit) constitué des ressources fournies par ses utilisateurs Le Cloud Computing va-t-il tout résoudre? Amazon, Google, Flickr, Facebook ont des centaines de millions d utilisateurs Mais : Logiciel Propriétaire -> Logiciel Libre -> Stockage Propriétaire Pas d intéropérabilité (kidnapping des données), dispersion des données, pas de confidentialité (vie privée), boîtes noires (sécurité, autres services) Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 8 / 21

Plan 1 Introduction Définition Pourquoi la sauvegarde collaborative? Les atouts de la sauvegarde collaborative Les alternatives P2P versus Cloud Computing 2 Fonctionnement Vue d ensemble Confidentialité des données Réplication versus Codes Correcteurs Maintenance des données 3 Simulations de faisabilité 4 Conclusion Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 9 / 21

Fonctionnement La sauvegarde Détection des modifications du système de fichiers Extraction des données à sauvegarder Chiffrement des données Constitution d archives de fichiers Sélection des points de stockage Transferts des archives et index à distance La restauration Récupération des points de stockage Récupération des listes de fichiers Téléchargement des archives Extraction des fichiers Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 10 / 21

Fonctionnement La sauvegarde Détection des modifications du système de fichiers Extraction des données à sauvegarder Chiffrement des données Constitution d archives de fichiers Sélection des points de stockage Transferts des archives et index à distance La restauration Récupération des points de stockage Récupération des listes de fichiers Téléchargement des archives Extraction des fichiers Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 10 / 21

Confidentialité des données La nécessité du chiffrement Les données sauvegardées peuvent être : Interceptées sur le réseau examinées par le propriétaire d un point de stockage Aucune donnée n est transmise sur le réseau sans chiffrement préalable Méthode de chiffrement Chaque utilisateur possède une paire de clés asymétriques Création d une clé de session par archive Chiffrement asymétrique de la clé de session (RSA) Auto-Chiffrement des fichiers (AES sur hash du fichier) Chiffrement symmétrique des hashs de fichiers Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 11 / 21

Confidentialité des données La nécessité du chiffrement Les données sauvegardées peuvent être : Interceptées sur le réseau examinées par le propriétaire d un point de stockage Aucune donnée n est transmise sur le réseau sans chiffrement préalable Méthode de chiffrement Chaque utilisateur possède une paire de clés asymétriques Création d une clé de session par archive Chiffrement asymétrique de la clé de session (RSA) Auto-Chiffrement des fichiers (AES sur hash du fichier) Chiffrement symmétrique des hashs de fichiers Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 11 / 21

Réplication versus Codes Correcteurs Tolérer les pannes des points de stockage Exemple : coût pour protéger une archive de 100 Mo contre 9 pannes Réplication : simples copies Le système crée 10 copies des 100 Mo sur 10 pairs Coût total : 1 Go, coût réparation : 100 Mo Codes correcteurs : combinaisons linéaires Le système découpe l archive en 10 blocs de 10 Mo Ajout de 9 blocs de 10 Mo, combinaisons linéaires des précédents Les 19 blocs sont répartis sur 19 pairs Coût total : 190 Mo, coût réparation : 100 Mo Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 12 / 21

Réplication versus Codes Correcteurs Tolérer les pannes des points de stockage Exemple : coût pour protéger une archive de 100 Mo contre 9 pannes Réplication : simples copies Le système crée 10 copies des 100 Mo sur 10 pairs Coût total : 1 Go, coût réparation : 100 Mo Codes correcteurs : combinaisons linéaires Le système découpe l archive en 10 blocs de 10 Mo Ajout de 9 blocs de 10 Mo, combinaisons linéaires des précédents Les 19 blocs sont répartis sur 19 pairs Coût total : 190 Mo, coût réparation : 100 Mo Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 12 / 21

Réplication versus Codes Correcteurs Tolérer les pannes des points de stockage Exemple : coût pour protéger une archive de 100 Mo contre 9 pannes Réplication : simples copies Le système crée 10 copies des 100 Mo sur 10 pairs Coût total : 1 Go, coût réparation : 100 Mo Codes correcteurs : combinaisons linéaires Le système découpe l archive en 10 blocs de 10 Mo Ajout de 9 blocs de 10 Mo, combinaisons linéaires des précédents Les 19 blocs sont répartis sur 19 pairs Coût total : 190 Mo, coût réparation : 100 Mo Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 12 / 21

Dégradation de la sauvegarde Le nombre de réplicas décroît en permanence : Déconnexions définitives des pairs à remplacer Déconnexions temporaires des pairs à ne pas remplacer! Pairs malicieux ne stockant pas les données Danger de pertes de données : Trop peu de réplicas : impossible de restaurer les données réparation régulière des réplicas Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 13 / 21

Dégradation de la sauvegarde Le nombre de réplicas décroît en permanence : Déconnexions définitives des pairs à remplacer Déconnexions temporaires des pairs à ne pas remplacer! Pairs malicieux ne stockant pas les données Danger de pertes de données : Trop peu de réplicas : impossible de restaurer les données réparation régulière des réplicas Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 13 / 21

Maintenance de la sauvegarde Surveillance des points de stockage Le système doit observer la disponibilité des pairs stockant les données en permanence En cas de risque, le système doit rétablir la redondance Utilisation de codes correcteurs minimisant le coût des réparations Vérification des données Envoyer régulièrement des challenges pour vérifier que les pairs n ont pas effacé les données stockées Infinité de challenges cryptographiques générées à partir d une signature de chaque bloc et de fonctions homomorphiques. Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 14 / 21

Maintenance de la sauvegarde Surveillance des points de stockage Le système doit observer la disponibilité des pairs stockant les données en permanence En cas de risque, le système doit rétablir la redondance Utilisation de codes correcteurs minimisant le coût des réparations Vérification des données Envoyer régulièrement des challenges pour vérifier que les pairs n ont pas effacé les données stockées Infinité de challenges cryptographiques générées à partir d une signature de chaque bloc et de fonctions homomorphiques. Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 14 / 21

Plan 1 Introduction Définition Pourquoi la sauvegarde collaborative? Les atouts de la sauvegarde collaborative Les alternatives P2P versus Cloud Computing 2 Fonctionnement Vue d ensemble Confidentialité des données Réplication versus Codes Correcteurs Maintenance des données 3 Simulations de faisabilité 4 Conclusion Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 15 / 21

Simulations Simulation d une sauvegarde collaborative Pairs triés suivant leur participation au système Mesure fiable de la disponibilité Incitations à participer : Les pairs les plus stables préfèrent les pairs les plus stables Les nouveaux pairs doivent travailler plus, mais pas trop Mesure du nombre de réparations pour 1000 heures (41 jours) Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 16 / 21

Pairs les plus stables Redundancy Simulation 12000 10000 total nodes actives nodes repair(/1000) datas lost(/1000) chunks min(*40) chunks mean(*40) 128 (40) unrestored mean(*80) 7 6 8000 5 4 value 6000 value 3 4000 2 2000 1 0 0 0 10000 20000 30000 40000 50000 60000 Hours Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 17 / 21

Pairs moins stables Redundancy Simulation 12000 10000 total nodes actives nodes repair(/1000) datas lost(/1000) chunks min(*40) chunks mean(*40) 128 (40) unrestored mean(*80) 4.5 4 3.5 8000 3 2.5 value 6000 value 2 4000 1.5 1 2000 0.5 0 0 0 10000 20000 30000 40000 50000 60000 Hours Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 18 / 21

Pairs les moins stables Redundancy Simulation 12000 10000 total nodes actives nodes repair(/1000) datas lost(/1000) chunks min(*40) chunks mean(*40) 128 (40) unrestored mean(*80) 8 7 6 8000 5 value 6000 4 value 4000 3 2 2000 1 0 0 0 10000 20000 30000 40000 50000 60000 Hours Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 19 / 21

Plan 1 Introduction Définition Pourquoi la sauvegarde collaborative? Les atouts de la sauvegarde collaborative Les alternatives P2P versus Cloud Computing 2 Fonctionnement Vue d ensemble Confidentialité des données Réplication versus Codes Correcteurs Maintenance des données 3 Simulations de faisabilité 4 Conclusion Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 20 / 21

Conclusion Une application prometteuse Un besoin important pour les particuliers/professionnels Une technologie à contre-courant du Cloud Computing Pas ou peu deployée : beaucoup de problèmes pour passer de la théorie à la pratique Réhabilitation du pair-à-pair Fabrice Le Fessant () Backup en pair-à-pair Rennes 2008 21 / 21