L'ÉNERGIE DANS LES BASES DE DONNÉES



Documents pareils
Présentation du module Base de données spatio-temporelles

Découvrez les Nouveautés Février 2010 du Catalogue PC Pack PRO

CYCLE CERTIFIANT ADMINISTRATEUR BASES DE DONNÉES

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Sécuristation du Cloud

Les bases de données

<Insert Picture Here> Exadata Storage Server et DB Machine V2

CAHIER DES CHARGES D IMPLANTATION

HP 600PD TWR i G 4.0G 39 PC

Ora2Pg Performances. (C) 2013 Gilles Darold

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

CUOMO PC Route d Oron Lausanne 021/

Encryptions, compression et partitionnement des données

Comparaison du coût total de propriété de MongoDB et d Oracle. Un livre blanc 10gen

Dossier I Découverte de Base d Open Office

Évaluation et optimisation de requêtes

C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes

Administration de Bases de Données : Optimisation

Une nouvelle génération de serveur

Documentation d information technique spécifique Education. PGI Open Line PRO

<Insert Picture Here> Solaris pour la base de donnés Oracle

Introduction aux SGBDR

1 Introduction et installation

Pascale Borla-Salamet Consultante Avant Vente Oracle France. Oracle Exadata Performance et Optimisation de votre Datawarehouse

cc.region.beaujeu@wanadoo.fr Site Internet Actuellement nous trouvons ce schéma réseau :

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E GHz

I00 Éléments d architecture

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse

Oracle 11g Optimisez vos bases de données en production (ressources matérielles, stockage, mémoire, requêtes)

Master Exploration Informatique des données DataWareHouse

Bases de données cours 1

Information utiles. webpage : Google+ : digiusto/

Optimisations des SGBDR. Étude de cas : MySQL

Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows W2K pro: configuration.

Le Langage SQL version Oracle

Structure de base d un ordinateur

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Maarch Framework 3 - Maarch. Tests de charge. Professional Services. 11, bd du Sud Est Nanterre

Du 10 Fév. au 14 Mars 2014

TP Bases de données réparties

Bases de données avancées Introduction

Le langage SQL Rappels

Bénéficiez d'un large choix d'applications novatrices et éprouvées basées sur les systèmes d'exploitation i5/os, Linux, AIX 5L et Microsoft Windows.

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

Architecture des Ordinateurs. Partie II:

Virtualisation des ressources serveur. Exemple : Systèmes partitionnés sous HP-UX et Oracle

Spécifications d'impression Jusqu'à 12 ppm

Samsung Data Migration v2.6 Guide d'introduction et d'installation

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

ORACLE 10g Découvrez les nouveautés. Jeudi 17 Mars Séminaire DELL/INTEL/ORACLE

Exigences système BauBit pro

Configuration système requise

LES DATACENTRES. ANGD MATHRICE Novembre Françoise Berthoud Violaine Louvet. Merci à Dominique Boutigny. Site web :

Java et les bases de données

Sur un ordinateur portable ou un All-in-One tactile, la plupart des éléments mentionnés précédemment sont regroupés. 10) 11)

Présentation du PL/SQL

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2

Exigences système Commercial & Digital Printing

JetClouding Installation

Cours Bases de données

Configuration matérielle et logicielle requise et prérequis de formation pour le SYGADE 6

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

& collaborative workspace. the new multitouch CONNECT & SHARE COLLABORATE BETTER & DECIDE FASTER CREATE & INNOVATE SAVE & TAKE THE DATA WITH YOU

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Protection des données avec les solutions de stockage NETGEAR

Session S12 Les bases de l optimisation SQL avec DB2 for i

CATEGORIE 1 : Portable basique. Référence constructeur (le cas échéant)

Exigences système Commercial & Digital Printing

//////////////////////////////////////////////////////////////////// Administration bases de données

Systèmes d informations nouvelles générations. Répartition, Parallèlisation, hétérogénéité dans les SGBD. Exemple d application d un futur proche

Master I Génie Logiciel

ELO Office / Pro Les avantages : Archivage et gestion documentaire

neotechpro catalogue neotechpro NeoTechPro International

La dernière base de données de Teradata franchit le cap du big data grâce à sa technologie avancée

Logiciel MAXPRO NVR SOLUTION D ENREGISTREMENT VIDÉO RÉSEAU

Windows 7 - Installation du client

ERP Service Negoce. Pré-requis CEGID Business version sur Plate-forme Windows. Mise à jour Novembre 2009

A.E.C. GESTION DES APPLICATIONS TECHNOLOGIE DE L'INFORMATION LEA.BW

Les bases de l optimisation SQL avec DB2 for i

ISC Système d Information Architecture et Administration d un SGBD Compléments SQL

Bases de Données. Plan

Globe Services Informatique

ECR_DESCRIPTION CHAR(80), ECR_MONTANT NUMBER(10,2) NOT NULL, ECR_SENS CHAR(1) NOT NULL) ;

Options indispensables, fortement conseillées pour démarrer sans soucis

Sybase Adaptive Server Enterprise 15

Bases de données et sites WEB Licence d informatique LI345

Big Data et Graphes : Quelques pistes de recherche

IT SERVICES BUSINESS STORAGE DATA AUDIT PARTNERSHIP INTEGRATOR SECURITY PLANNING PRIVATE AGILITY DYNAMIC PUBLIC TECHNOLOGY SOLUTIONS MANAGEMENT

OpenPaaS Le réseau social d'entreprise

Cours 3. Développement d une application BD. DBA - Maîtrise ASR - Université Evry

ORACLE EXADATA DATABASE MACHINE X2-8

Guide d'installation d'esprit Version 2014 R2

Ordinateur portable Latitude E5410

LOT N 1 : ORDINATEURS BORDEREAU DE PRIX IDENTIFICATION DU FOURNISSEUR. Code DESIGNATION QTE PU HT EN EURO MONTANT TOTAL HT EN EURO MONTANT TTC EN EURO

SQL Server 2008 et YourSqlDba

Transcription:

L'ÉNERGIE DANS LES BASES DE DONNÉES Amine Roukh Faculté des Sciences Exactes & Informatique Université de Mostaganem amineroukh@gmail.com

CONTEXTE L'amélioration de performance des systèmes informatiques reste l'objectif principal des chercheurs. L'énergie reste dans la 2ème position en terme d'importance, jusqu'à maintenant...

L'électricité utilisée pour alimenter les ordinateurs dans le monde: 225TWh en 2013. Ce nombre ne cesse de croître chaque année. Problème de coût, production de chaleur ( ). CO 2

L'ÉNERGIE DANS LES BASES DONNÉES La gestion de l'énergie commence à attirer l'attention de la communauté des bases de données (depuis 2009). S'adapter dynamiquement et affiner les stratégies de gestion des données pour respecter le temps de réponse et permettre une meilleur gestion de l'énergie.

La solution la plus performante consomme plus d'énergie

Perdre quelque millisecondes et gagne plus d'énergie!

DEUX APPROCHES APPROCHE MATÉRIEL: Un matériel avec faible profils d'énergie: Solid State Drive (SSD) et la mémoire Flash. Graphics Processing Units (GPU). CPUs avec fréquence dynamique de tension (DVFS).

APPROCHE LOGICIELS: Introduit des nouveaux algorithmes ou refonter les SGBDs pour réduire la consommation d'énergie. QED : Improved Query Energy efficiency by Introducing Explicit Delays. PET : (Power Energy Time). E 2 DBMS, P-DBMS.

MOSÉLISATION D'ÉNERGIE SQL Pour estimer l'énergie d'une requête if faut modéliser chaque opérateur algébrique. Sélection, Projection, Jointure. Avec différent algorithmes (accès séquentiel, index, boucle imbriquée...). Utiliser la régression linéaire.

LA RÉGRESSION LINÉAIRE y = + + +...+ + i β 0 β 1 x i,1 β 2 x i,2 β n x i,n ϵ i y = [ y 1, y 2,..., y ] k = [,,..., ] : erreur des mésures. : vecteur des puissances mesurées. : vecteur des variables. x i x i,1 x i,2 x i,n n ϵ i x i est lu à partir des statistiques de la base de données. L'esimation des paramètres de modèle résoudre l'équation. β

MOSÉLISATION DES OPÉRATEURS ALGÉBRIQUES Implémentation du modèle de Lang et al pour les opérations SQL de type accès séquentiel et jointure. Pas de cache, pas de requêtes parallèle. Supposons les deux tables R et S, où S est table la plus large. R et S le cardinal des relations. est la sélectivité des prédicats (connue). sel

Pour exécuter une requête de type accès séquentiel sur la table R: Le CPU doit effectuer une comparaison pour chaque tuple. Une opération de sauvegarde pour les tuples qui satisfont le prédicat. L'équation de prédiction peut être écrit comme suit : y = + R + sel R β 0 β 1 β 2

On suppose que le SGBD utilise la jointure par hachage avec l'algorithme Grace: R S Partitionner et avec une fonction de hachage. Chaque partition de R est lue dans la mémoire. Chaque tuple dans la partition correspondante dans S est lu et comparé. S'il y a une correspondance, le tuple est ajouté au résultat. L'équation devient : y = + (2 R + S ) + S β 0 β 1 β 2 + ( R + S + sel R S ) β 3

APPRENTISSAGE 1. Dans une deuxième étape il faut trouver les, en effectuant une série d'observations. 2. Lors d'une observation, la puissance est capturée par un équipement de mesure. 3. De même, les paramètres de requête sont lues à partir de la base de données. β i

Cela conduit à un système d'équations linéaires de forme: = + +...+ = + +...+... y = i β 1 x i,1 + β 2 x i,2 +...+ β n x i,n y 1 β 1 x 1,1 β 2 x 1,2 β n x 1,n y 2 β 1 x 2,1 β 2 x 2,2 β n x 2,n On obtient le meilleur ajustement des coefficients régression linéaire. β par une

Nous avons crée une charge de requêtes de type accès séquentiel, de forme : SELECT * FROM LINEORDER WHERE L_ORDERKEY > k; Pour la jointure par hachage : SELECT * FROM LINEORDER, PART WHERE LO_PARTKEY = P_PARTKEY AND LO_ORDERKEY > k; Le paramètre k permet de contrôler la sélectivité des prédicats.

TESTE Nous avons crée une autre charge de requêtes avec des sélectivités différentes pour la phase de teste. Les requêtes et leur sélectivités (Tuple X1000).

EXPÉRIMENTATIONS ET RÉSULTATS HP Compaq 600 Pro, Intel Core2 Duo E7500 2.93GHz. 2x1Go RAM et un HDD Hitachi de 300Go. Multimètre numérique Uni-Trend UT805A. Le SE est Linux Kubuntu 13.10. Le SGBD est Oracle 11gR2. Entrepôt de données SSB (Star Schema Benchmark) de 1Go. Le langage R pour la régression.

Schéma de simulation.

Architecture de simulation.

Erreur: ±3.2 Watts.

Erreur: ±4.3 Watts.

PROBLÈME Validation du modèle avec un autre entrepôt de données (BENCHW). Erreur: ±23.8 Watts.

CONCLUSION & PERSPECTIVES Le problème de la modélisation d'énergie dans les base de données. Expérimentations avec une méthodologie d'éstimation d'énergie. La méthodologie est basée sur l'apprentissage et la régression linéaire. La cardinalité de la table ainsi que le nombre de colonnes et la sélectivité influencent sur la consommation d'énergie.

Modéliser la consommation de la mémoire, le disque dur. Développer un modèle de coût énergétique. Intégrer le modèle dans une structure d'optimisation.

RÉFÉRENCES McCullough et al. Evaluating the effectiveness of model-based power characterization. 2011 Xu et al. Exploring power-performance tradeoffs in database systems. 2010. Lang et al. Rethinking query processing for energy efficiency: Slowing down to win the race. 2011. Xu et al. Dynamic Energy Estimation of Query Plans in Database Systems. 2013.