Bases de données documentaires et distribuées Cours NFE04



Documents pareils
Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04

Edition Nomenclatures d activités et de produits françaises NAF rév. 2 - CPF rév. 2.1 Section J Division 60

Pourquoi archiver les s

Synchroniser le son et la vidéo dans Lightworks

Aide à la clé pédagogique «Former à la première intervention et à l évacuation»» 2 e édition

Mes documents Sauvegardés

TD : Codage des images

Webinar. Découvrez Rubedo, la première solution CMS open-source tirant profit des atouts de Zend Framework et du NoSQL. avec la participation de

«SESSION 2009» RESEAUX DE TELECOMMUNICATIONS ET EQUIPEMENTS ASSOCIES. Durée : 2 h 00 (Coef. 3)

Système de Stockage Sécurisé et Distribué

Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

Distinguer entre «Enregistrer» et «Sauvegarder»

QU EST-CE QUE LA VOIX SUR IP?

Chaine de transmission

GeniusTim_Labo Version 1.0

Docteur José LABARERE

GUIDE D'INSTALLATION. AXIS Camera Station

Sécuristation du Cloud

Note technique. Formats de compression vidéo utilisés par CamTrace V11 avantages et inconvénients.

CORBA haute performance

Chapitre 18 : Transmettre et stocker de l information

Techniques de stockage. Techniques de stockage, P. Rigaux p.1/43

Année Universitaire session 1 d automne Parcours : CSB5 Licence 3 STS Informatique

Une solution de stockage VDI unifiée, flexible et disponible pour vos utilisateurs

Master e-secure. VoIP. RTP et RTCP

Approche hybride de la QoS

Choisissez le logiciel Comptabilité adapté à vos besoins. Exploitez toutes les possibilités du logiciel Comptabilité sans attendre

Système clients serveur Kwartz Vulgarisation, identification, dossier personnel

CASSES : Logiciel de prévision des casses des réseaux r d alimentation en eau potable

Ebauche Rapport finale

Le crédit documentaire. Mai 2014

Chapitre 2. Eléments pour comprendre un énoncé

La maison connectée grâce au courant porteur en ligne (CPL)

Siège : Maison de la presse, Tokoin Trésor - BP : Lomé-Togo Tél : (00228) / / conapptogo@gmail.

Gestion collaborative de documents

MEMOIRES MAGNETIQUES A DISQUES RIGIDES

Performance et usage. La différence NETGEAR - R7000. Streaming HD illimitée

Commission Scolaire Des Grandes-Seigneuries Centre d Éducation des Adultes du Goéland. FORMATIF Arithmétique appliquée aux finances MAT

M1 Informatique, Réseaux Cours 9 : Réseaux pour le multimédia

La diffusion des technologies de l information et de la communication dans la société française

QoS et Multimédia SIR / RTS. Introduction / Architecture des applications multimédia communicantes

MECENAT SALON D ART CONTEMPORAIN. Paris New-York Miami Shanghaï. Business. Tokyo Casablanca Moscou Bruxelles. . org.

Optimisation WAN de classe Centre de Données

Chap17 - CORRECTİON DES EXERCİCES

S cribe N G pour l'en seignant

Être conforme à la norme PCI. OUI, c est possible!

Description du programme du Master M2 MIAGE SIIN (1)

Cours n 12. Technologies WAN 2nd partie

Utiliser les infopages

Contributions à l expérimentation sur les systèmes distribués de grande taille

La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA)

PROGRAMMES D INFORMATIQUE

CHAPITRE 3 L AMORTISSEMENT LINEAIRE

Réussir l implémentation de Solid Edge Insight XT avec Digicad

moobee mail vous ouvre les portes de l ing

MATHÉMATIQUES FINANCIÈRES

Micro-ordinateurs, informations, idées, trucs et astuces. Utiliser une caméra IP Trendnet IP-TV110. Auteur : François CHAUSSON

La communication et la gestion de l'information

La Voix sur IP OLIVIER D.

Configuration d un client Outlook 2010

Réplication adaptative sur les réseaux P2P

du marketing digital

LE CONCEPT VADWAY et le «CONTRÔLE DE GESTION»

Tests de performance du matériel

VidZone, qu est-ce que c est? INSTALLATION DE VidZone

Interactions des rayonnements avec la matière

Créer une base de données vidéo sans programmation (avec Drupal)

Le e s tocka k ge g DAS,NAS,SAN

Société MAINTINFO MAINTENANCE D'EQUIPEMENTS INFORMATIQUES ETUDE DE CAS (UML) Document d'expression des Besoins. Page 1

RECHERCHER ACCÉDER PROTÉGER. Solutions professionnelles pour la protection et l exploitation sécurisée des données informatiques

Prototypage et évaluation de performances d un service de traçabilité avec une architecture distribuée basée sur Hadoop

Excel 2010 Module 13. Comment créer un tableau d amortissement dégressif d une immobilisation. Enseignant : Christophe Malpart

Julien MATHEVET Alexandre BOISSY GSID 4. Rapport RE09. Load Balancing et migration

Instruction de la Direction du Crédit et des Marchés de Capitaux de Bank AI-Maghrib (Service Central des Risques ) du 23 janvier 2003

OpenScribe L ECM Sagem. Pour maîtriser simplement tous les flux d informations

Fonctions de deux variables. Mai 2011

PRECISION - REJET DE PERTURBATIONS T.D. G.E.I.I.

- I - Fonctionnement d'un détecteur γ de scintillation

Business & High Technology

Présentation du service «photothèque-and-co» annuaire professionnel. base de données

CONCOURS GÉNÉRAL SÉNÉGALAIS 1/6 Durée : 6 heures Série : G SESSION 2004 CLASSES DE TERMINALE

CONDITIONS GENERALES DE VENTE TRAVELDEAL.MA ARTICLE 1 : OBJET ET PORTÉE DES CONDITIONS GÉNÉRALES DE VENTE

Analyse de la bande passante

La diffusion des technologies de l information et de la communication dans la société française

ANNEXE. PROGRAMME DES FORMATIONS DISPENSÉES AU CLUB MONTALEAU (ANNÉE 2014/2015)

EMC Forum EMC ViPR et ECS : présentation des services software-defined

Sauvegarder et restaurer les données PMB

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

TP 7 : oscillateur de torsion

ASSOCIATION NATIONALE D'ASSISTANCE ADMINISTRATIVE ET FISCALE DES AVOCATS

_ PARAMETRE DU COMPTE _ ACCEUIL. 1 ere Etape «Créer un compte principal» Créer un compte secondaire. Ouvrir un compte principal

Fiche d identité produit

Statistique : Résumé de cours et méthodes

Transcription:

Bases de données documentaires et distribuées Cours NFE04 Scalabilité Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département d informatique Conservatoire National des Arts & Métiers, Paris, France

Définition Une définition (stricte) de la scalabilité Nous partons de la définition suivante. Définition Un système est scalable si ses performances sont proportionnelles aux ressources qui lui sont allouées. où le système est un système distribué de gestion de données ; les ressources sont les composants matériels (serveurs, connectique) ; la performance est mesurée soit par la latence pour les systèmes temps réel (temps d accès à un document) ; soit par le débit pour les systèmes analytiques (temps de parcours d une collection). On quantifie les grandeurs ressource et performance ; on montre que leur rapport est constant pour un volume de données fixé.

Exemple 1 : comptons les documents Premier exemple : comptage des vidéos On veut compter les vidéos dans la collection. Avec un serveur : on lit la collection sur le disque, on compte : 100 MO/s Avec deux serveurs : on répartit la collection en deux parties égales, chaque serveur lit sur son disque : 200 MO/s avec n serveurs : on répartit en n, on lit en parallèle : n 100 MO/s À la fin, le ou les serveurs envoie(nt) leur compte à l application qui cumule (coût 0 ou presque). Rapport performance/ressources = (débit global / nb serveurs) = 100 MO/s!

Exemple 1 : comptons les documents La méthode Important Le fait que le temps soit constant par serveur (courbe verte) est une condition nécessaire mais pas suffisante! Par exemple : si j envoie toutes les vidéos au client, le coût réseau (500 TOs!) devient prépondérant.

Second exemple : on cherche des doublons Comment savoir si on a des vidéos en double (des contenus identiques)? On procède en deux étapes parcours des vidéos, calcul d une signature ; on produit la liste des paires (i,s), i id de la vidéo, s signature ; regroupement des paires par signature : si deux signatures (ou plus) égales sont trouvées, c est un doublon! Et on envoie au client la liste des doublons.

Etape 1 La première étape se déroule entièrement en parallèle sur les serveurs. Scalable, pour les mêmes raisons que l exemple 1.

Etape 2 La seconde étape implique des échanges réseaux : on alloue à chaque serveur un sous-ensemble des signatures, et on lui transmet les paires de la liste pour ces signatures. Scalable? Peut-on augmenter linéairement le débit d un réseau?

Analyse On échange sur le réseau un paire (i,s) pour chaque document. La taille est totalement négligeable par rapport à celle du document lui-même. Conclusion : le coût des accès disques est largement prépondérant ; la méthode est scalable (pas parfaitement...) A vérifier Il faudrait quantifier les coûts respectifs des accès disques et réseau (cf. la suite)

Quelques conclusions générales Quelques conditions favorables (voire indispensables) Données équitablement réparties. Traitement essentiellement local. Limitation des transferts réseaux, entre les serveurs et vers le client. Et un temps de calcul global qui reste raisonnable pour les ressources qu on peut/veut lui allouer... Scalable mais pas acceptable? Le fait d être scalable (selon notre définition) ne veut pas dire que le temps de calcul est acceptable. Si un traitement prend 10 ans, il prendra encore 5 ans en doublant les ressources...