Étude des Systèmes Pair-à-Pair



Documents pareils
Contributions à l expérimentation sur les systèmes distribués de grande taille

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Architecture de la grille

NIMBUS TRAINING. Administration de Citrix NetScaler 10. Déscription : Objectifs. Publics. Durée. Pré-requis. Programme de cette formation

Cloud Computing. Introduction. ! Explosion du nombre et du volume de données

Développement logiciel pour le Cloud (TLC)

Clouds/Big Inria. Frédéric Desprez Frederic.Desprez@inria.fr

Plateforme Technologique Innovante. Innovation Center for equipment& materials

LES APPROCHES CONCRÈTES POUR LE DÉPLOIEMENT D INFRASTRUCTURES CLOUD AVEC HDS & VMWARE

HSCS 6.4 : mieux appréhender la gestion du stockage en environnement VMware et service de fichiers HNAS Laurent Bartoletti Product Marketing Manager

Containers : Outils magiques pour les Devops? OpenNebula et son écosystème pour une infrastructure cloud agile

bienvenue chez Orange

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr

Grid 5000 : Administration d une infrastructure distribuée et développement d outils de déploiement et d isolation réseau

Un exemple de cloud au LUPM : Stratuslab

APX et VCE, Modèle d industrialisation de l intégration et du déploiement. Olivier BERNARD, VCE

VMware : De la Virtualisation. au Cloud Computing

La virtualisation, si simple!

bienvenue chez Orange

Administration de Citrix NetScaler 10 CNS-205-1I

Sustainability Monitoring and Reporting: Tracking Your Community s Sustainability Performance

Gouvernance et nouvelles règles d organisation

Ecole Mohammadia d Ingénieurs Systèmes Répartis Pr. Slimane Bah, ing. PhD G. Informatique Semaine 24

POSITION DESCRIPTION DESCRIPTION DE TRAVAIL

Cycle Innovation & Connaissance 12 petit déjeuner Mardi 15 mai Cloud Computing & Green IT : nuages ou éclaircies?

Institut français des sciences et technologies des transports, de l aménagement

Frequently Asked Questions

PLM 2.0 : Mise à niveau et introduction à l'offre version 6 de Dassault systèmes

Protection de l Investissement Virtualisation, Efficacité énergétique

Editing and managing Systems engineering processes at Snecma

CEPF FINAL PROJECT COMPLETION REPORT

0,3YDQGLWVVHFXULW\ FKDOOHQJHV 0$,1²0RELOLW\IRU$OO,31HWZRUNV²0RELOH,3 (XUHVFRP:RUNVKRS %HUOLQ$SULO

SCALABLE ROUTING PROTOCOLS WITH APPLICATIONS TO MOBILITY

Empowering small farmers and their organizations through economic intelligence

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

.Réinventons l innovation.

Nouveautés printemps 2013

Engineered for Business: Oracle Hardware for Oracle Database

CONTRIBUTIONS À L EXPÉRIMENTATION

Séminaire Partenaires Esri France 7-8 juin Paris Cloud Computing Stratégie Esri

We Generate. You Lead.

Le socle de sécurité nouvelle génération Consolider, virtualiser et simplifier les architectures sécurisées

Virtualisation & Sécurité

Une nouvelle Famille de systèmes

ORACLE PAAS CLOUD MANAGEMENT

Sécurité des systèmes d exploitation

ICT7 Luxembourg. ICT7 Belgium. ICT7 France. 33 people. 12 people. 2 people

Le Cloud Computing est-il l ennemi de la Sécurité?

Optimized Protocol Stack for Virtualized Converged Enhanced Ethernet

Middleware et services de la grille

La stratégie Cloud de Microsoft

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Cedric Dumoulin (C) The Java EE 7 Tutorial

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

VTP. LAN Switching and Wireless Chapitre 4

Estimated SMB instances PC (Physical and Virtual) 125,000 Total instances: SMB 1-24 PC. 392,000 Total instances: SMB PC

StratusLab : Le projet et sa distribution cloud

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

FOURNIR UN SERVICE DE BASE DE DONNÉES FLEXIBLE. Database as a Service (DBaaS)

L OBSERVATOIRE DE LA BIOLOGIE DE SYNTHESE SYNTHETIC BIOLOGY OBSERVATORY

Kick Off SCC EMC l offre EXTREMIO. fmarti@fr.scc.com Philippe.rolland@emc.com. Vers de nouveaux horizons

La gestion des vulnérabilités par des simulations d'attaques

Face Recognition Performance: Man vs. Machine

Plan. Department of Informatics

Cours 13. RAID et SAN. 2004, Marc-André Léger

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

VMware Infrastructure The New Computing Platform. Stéphane CROIX Systems Engineer

Revision of hen1317-5: Technical improvements

Services à la recherche: Data Management et HPC *

IPv6: from experimentation to services

Configuration Cluster, DRS, HA, DPM et FT

HAUTE DISPONIBILITÉ DE MACHINE VIRTUELLE AVEC HYPER-V 2012 R2 PARTIE CONFIGURATION OPENVPN SUR PFSENSE

Cloud Computing Quelles évolutions et quel potentiel économique?

Visualisation et Analyse de Risque Dynamique pour la Cyber-Défense

Outils d'analyse de la sécurité des réseaux. HADJALI Anis VESA Vlad

BONJOURGRID : VERSION ORIENTÉE DONNÉE & MAPREDUCE SÉCURISÉ

ERA-Net Call Smart Cities. CREM, Martigny, 4 décembre 2014 Andreas Eckmanns, Responsable de la recherche, Office Fédéral de l énergie OFEN

Mesures de performances Perspectives, prospective

COMPUTING. Jeudi 23 juin CLOUD COMPUTING I PRESENTATION

GRIDKIT: Pluggable Overlay Networks for Grid Computing

Plan de la conférence. Virtualization. Définition. Historique. Technique. Abstraction matérielle

Expérience de la mise en place s une solution de gestion de capacité pour supporter la migration des Datacenter

PACKZ System Requirements. Version: Version: Copyright 2015, PACKZ Software GmbH. 1

Prototype de canal caché dans le DNS

IT SERVICES BUSINESS STORAGE DATA AUDIT PARTNERSHIP INTEGRATOR SECURITY PLANNING PRIVATE AGILITY DYNAMIC PUBLIC TECHNOLOGY SOLUTIONS MANAGEMENT

Institut d Acclimatation et de Management interculturels Institute of Intercultural Management and Acclimatisation

NEC Virtual PC Center

L état de la virtualisation

Un projet communevo / UPMC

Archived Content. Contenu archivé

Les mésocentres HPC àportée de clic des utilisateurs industriels

Règlement sur le télémarketing et les centres d'appel. Call Centres Telemarketing Sales Regulation

vcloud Director Comment créer et gérer son «Cloud» Jean-Claude DAUNOIS Senior Systems Engineer VMware

SCC / QUANTUM Kickoff 2015 Data Protection Best Practices

Instructions Mozilla Thunderbird Page 1

What s New. Sun ONE Application Server. Version 7, Enterprise Edition

Forthcoming Database

Copyright 2014, Oracle and/or its affiliates. All rights reserved.

Lean approach on production lines Oct 9, 2014

Transcription:

Étude des Systèmes Pair-à-Pair Lucas Nussbaum Thèse (BDI CNRS) démarrée en octobre 2005 Groupe de travail Mescal - avril 2006 Lucas Nussbaum Étude des systèmes pair-à-pair 1 / 34

Summary 1 Grid Computing vs Peer-to-peer 2 Study of Peer-to-Peer systems 3 P2PLab 4 Future work Lucas Nussbaum Étude des systèmes pair-à-pair 2 / 34

Definitions Target communities Resources Applications Scale & Failure Infrastructure Future Summary 1 Grid Computing vs Peer-to-peer Definitions Target communities Resources Applications Scale & Failure Infrastructure Future 2 Study of Peer-to-Peer systems 3 P2PLab 4 Future work Lucas Nussbaum Étude des systèmes pair-à-pair 3 / 34

Definitions Target communities Resources Applications Scale & Failure Infrastructure Future Grid Computing vs Peer-to-peer Source : On Death, Taxes, and the Convergence of Peer-to-Peer and Grid Computing (Ian Foster and Adriana Iamnitchi, IPTPS 03) Trying to define what they are Comparing them : similarities and divergence Lucas Nussbaum Étude des systèmes pair-à-pair 4 / 34

Definitions Target communities Resources Applications Scale & Failure Infrastructure Future Definitions : Grid Computing Grids Sharing environments implemented via the deployment of a persistent, standards-based service infrastructure that supports the creation of, and resource sharing within, distributed communities. Resources : computers, storage space, data... owned by various organizations and shared under locally defined policies Connected through the Internet and a middleware software layer Provides services for security, monitoring, resource management,... Lucas Nussbaum Étude des systèmes pair-à-pair 5 / 34

Definitions Target communities Resources Applications Scale & Failure Infrastructure Future Definitions : Peer-to-Peer Peer-to-Peer Class of applications that takes advantage of resources (storage, cycles, content,...) available on the edge of the Internet. Unstable connectivity and unpredictable IP addresses (often) independence from DNS and central servers (overlay networks) Lucas Nussbaum Étude des systèmes pair-à-pair 6 / 34

Definitions Target communities Resources Applications Scale & Failure Infrastructure Future Comparing : Target communities and incentives Grids Professional communities : scientific (and now commercial) Established communities trust, accountability, sanctions when wrong behaviour Dynamic organizations and membership difficult to impose solutions Peer-to-Peer Anonymous individuals No reason to act collaboratively submission of incorrect results, free riding Incentives required Need for other participation models in both systems Lucas Nussbaum Étude des systèmes pair-à-pair 7 / 34

Definitions Target communities Resources Applications Scale & Failure Infrastructure Future Comparing : Resources Grids Resources : more powerful and better connected than P2P resources Publication of resources properties High resources availability Peer-to-peer systems Intermittent participation Highly variable behaviour Lucas Nussbaum Étude des systèmes pair-à-pair 8 / 34

Definitions Target communities Resources Applications Scale & Failure Infrastructure Future Comparing : Applications Grids Middleware Low deployment cost for applications communications-intensive apps Peer-to-peer systems Vertically integrated solutions Specialized resource-sharing problems (CPU or files) CPU-oriented apps much less data intensive (SETI@home : 21 KB/hour) Lucas Nussbaum Étude des systèmes pair-à-pair 9 / 34

Definitions Target communities Resources Applications Scale & Failure Infrastructure Future Comparing : Scale and Failure Grids Thousands of nodes Scalability and self-management not a high priority for middleware Peer-to-peer systems Millions of active nodes Resilience and scalability Lucas Nussbaum Étude des systèmes pair-à-pair 10 / 34

Definitions Target communities Resources Applications Scale & Failure Infrastructure Future Comparing : Services and Infrastructure Grids multipurpose permanent infrastructure services (authentification, authorization, discovery, data movement,...) "Standard" toolkit (Globus) Peer-to-peer systems protocol designed for a specific purpose no trust assumptions incentives and reputation management, result checking services proposals for standard service infrastructure : JXTA, XtremWeb, BOINC. Lucas Nussbaum Étude des systèmes pair-à-pair 11 / 34

Definitions Target communities Resources Applications Scale & Failure Infrastructure Future Future? Probable convergence of some aspects But some distinctions will remain (accountability (Grids) vs anonymity (P2P)) Peer-to-peer systems In 2003, no common infrastructure In 2006, BOINC as the standard for computation-oriented applications? What about file-sharing apps? Lucas Nussbaum Étude des systèmes pair-à-pair 12 / 34

Peer-to-peer systems Solutions for P2P Study Summary Summary 1 Grid Computing vs Peer-to-peer 2 Study of Peer-to-Peer systems Peer-to-peer systems Solutions for P2P Study Summary 3 P2PLab 4 Future work Lucas Nussbaum Étude des systèmes pair-à-pair 13 / 34

Peer-to-peer systems Solutions for P2P Study Summary Peer-to-Peer systems Heterogeneous nodes (CPU, network) Non-persistent nodes Difficult (Impossible?) to control Hard to study (correctness, performance) and to understand Lucas Nussbaum Étude des systèmes pair-à-pair 14 / 34

Grid Computing vs P2P Study of P2P P2PLab Future work Peer-to-peer systems Solutions for P2P Study Summary Solutions for P2P Study cost Real systems Real applications Laboratory platforms Synthetic conditions Modeling systems & apps Virtual platforms Synthetic conditions Key mechanisms of the systems (Algorithms...) Real systems Real applications Real platforms Real conditions accuracy Modeling & Simulation Emulation Real Systems Lucas Nussbaum Étude des systèmes pair-à-pair 15 / 34

Peer-to-peer systems Solutions for P2P Study Summary Emulation : example physical machine 1 physical machine 2 Emulated Network physical machine 3 physical machine 4 Virtualization on the nodes Lucas Nussbaum Étude des systèmes pair-à-pair 16 / 34

Peer-to-peer systems Solutions for P2P Study Summary Existing tools Existing tools Modelnet, NetBed/Emulab, MicroGrid, PlanetLab Example : Modelnet Edge nodes switch Modelnet Core switch Lucas Nussbaum Étude des systèmes pair-à-pair 17 / 34

Peer-to-peer systems Solutions for P2P Study Summary Existing tools (2) Example : PlanetLab 700 distributed nodes available as a testbed for distributed systems research. But : 700 «millions Nodes hosted by universities, research centers, big corporations. "Real" internet? Lucas Nussbaum Étude des systèmes pair-à-pair 18 / 34

Peer-to-peer systems Solutions for P2P Study Summary Tools for emulation and virtualization Network emulation Change network link caracteristics (bandwidth, latency, congestion/packet loss) NIST Net (Linux 2.4 et 2.6) TC and Netem (Linux 2.6) Dummynet (FreeBSD) Virtualization Execute several instances of an application on the same physical system User Mode Linux VServer Xen Lucas Nussbaum Étude des systèmes pair-à-pair 19 / 34

Peer-to-peer systems Solutions for P2P Study Summary Summary Solutions aim at very high accuracy Efficiency? Scalability? Virtualization of a full operating system Really necessary for P2P systems? (vertically integrated apps) Network emulation targeting the network core Really important for P2P systems? (applications running on the edge of the internet) Lucas Nussbaum Étude des systèmes pair-à-pair 20 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité Summary 1 Grid Computing vs Peer-to-peer 2 Study of Peer-to-Peer systems 3 P2PLab Introduction P2PLab : virtualisation au niveau processus P2PLab : aspects réseaux P2PLab : Évaluation Rapport de virtualisation Passage à l échelle Équité et virtualisation 4 Future work Lucas Nussbaum Étude des systèmes pair-à-pair 21 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité P2PLab : Introduction Objectif général Système d émulation léger et efficace (bon rapport machines virtuelles/machines physiques) Pour les systèmes pair-à-pair Caractéristiques Utilise FreeBSD 5 (pour Dummynet) Virtualisation au niveau processus (virtualisation de l identité réseau) Émulation du réseau avec Dummynet : approche décentralisée pour un meilleur passage à l échelle Lucas Nussbaum Étude des systèmes pair-à-pair 22 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité P2PLab : virtualisation au niveau processus Associer une adresse IP à chaque processus, à la fois pour les clients et les serveurs Modification de la Libc (bind(), connect() et listen()) pour toujours faire un bind() sur l adresse de $BINDIP socket() bind() sendto(), recvfrom(), sendmsg(), recvmsg() connect() listen() accept() Lucas Nussbaum Étude des systèmes pair-à-pair 23 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité P2PLab : aspects réseaux Utilisation d interfaces aliasées (surcoût minimal) Gestion de l émulation réseau sur les noeuds, en entrée et en sortie Limitation du débit et ajout de latence pour chaque noeud virtuel Ajout de latence entre des groupes de noeuds virtuels Noeud Physique 3 Noeud Physique 1 Noeud Virtuel 3.1 Noeud Virtuel 3.2 Noeud Physique 2 Noeud Virtuel 1.1 Noeud Virtuel 2.1 Noeud Virtuel 1.2 Noeud Virtuel 2.2 Filtrage Dummynet en entrée Filtrage Dummynet en sortie Lucas Nussbaum Étude des systèmes pair-à-pair 24 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité Émulation de topologies réseaux 10.1.0.0/16 100ms 400ms 10.2.0.0/16 latence : 5ms bande passante : 10 Mbps 1000 noeuds 10.1.2.0/24 latence : 40ms bande passante : 512 kbps/128kbps 250 noeuds 10.1.1.0/24 latence : 100ms bande passante : 56kbps/33.6kbps 250 noeuds 1s 100ms 10.1.3.0/24 latence : 20ms bande passante : 8 Mbps/1Mbps 250 noeuds 100ms 600ms 10.3.0.0/16 latence : 10ms bande passante : 1 Mbps 1000 noeuds Lucas Nussbaum Étude des systèmes pair-à-pair 25 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité P2PLab : Évaluation Rapport de virtualisation Rapport nombre de machines virtuelles / nombre de machines physiques? Passage à l échelle Expériences avec un (très) grand nombre de noeuds? Problème : équité de la virtualisation Quel est le niveau d équité entre processus d un même noeud physique? Lucas Nussbaum Étude des systèmes pair-à-pair 26 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité Rapport de virtualisation Téléchargement d un fichier de 16 Mo par BitTorrent Entre 160 clients Démarrés toutes les 10s Caractéristiques du réseau : 2 mbps down, 128 kbps up, latence 30 ms Répartis sur 160 noeuds, puis 16, puis 8, puis 4, puis 2. Aucun surcoût visible même avec 80 clients par noeud Premier facteur limitant : performances du réseau sous-jacent Lucas Nussbaum Étude des systèmes pair-à-pair 27 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité Rapport de virtualisation (2) total amount of data received by clients (MB) 3000 2500 2000 1500 1000 500 1 client per physical node 10 clients per physical node 20 clients per physical node 40 clients per physical node 80 clients per physical node 0 0 500 1000 1500 2000 time (s) Lucas Nussbaum Étude des systèmes pair-à-pair 28 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité Passage à l échelle Téléchargement d un fichier de 16 Mo par BitTorrent Entre 5760 participants (5755 clients, 4 seeders, 1 tracker) Démarrés tous les 0.25s Répartis sur 5760/32 = 180 noeuds Caractéristiques du réseau : 2 mbps down, 128 kbps up, latence 30 ms Seuls les clients numérotés 0, 50, 100, 150,... 5750 sont affichés. Lucas Nussbaum Étude des systèmes pair-à-pair 29 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité Passage à l échelle (2) 100 percentage done on each client 80 60 40 20 0 0 500 1000 1500 2000 2500 time (s) Lucas Nussbaum Étude des systèmes pair-à-pair 30 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité Équité et virtualisation Question Niveau d équité entre les processus d une même machine? Expérience Lancement d un processus toutes les secondes S il était seul sur la machine, chaque processus calculerait pendant 12 secondes avant de terminer Mesure : temps pris par chaque processus pour terminer le calcul Lucas Nussbaum Étude des systèmes pair-à-pair 31 / 34

Intro Virtualisation Réseau Évaluation Virtualisation Passage à l échelle Équité Équité et virtualisation (2) 1200 1000 Scheduler ULE Scheduler 4BSD Linux 2.6 temps d execution (s) 800 600 400 200 0 0 10 20 30 40 50 60 70 80 90 100 numero du processus Lucas Nussbaum Étude des systèmes pair-à-pair 32 / 34

Summary 1 Grid Computing vs Peer-to-peer 2 Study of Peer-to-Peer systems 3 P2PLab 4 Future work Lucas Nussbaum Étude des systèmes pair-à-pair 33 / 34

Future work Comparaison plus poussée avec les autres systèmes : Modelnet, Microgrid, PlanetLab Étude des autres solutions de virtualisation (VServer, Xen) Virtualisation plus équitable, plus contrôlable? Linux TC + Netem Que peut-on en faire? À quel coût? Permettrait d utiliser Linux à la place de FreeBSD Convergence vers les générateurs de topologies "classiques" Quelle est l influence de la congestion dans le coeur d Internet sur le comportement des systèmes peer-to-peer? Expériences avec d autres systèmes P2P? Collaborations? DSLLab, XtremLab Lucas Nussbaum Étude des systèmes pair-à-pair 34 / 34