Centre de Calcul de l Institut National de Physique Nucléaire et de Physique des Particules CostModel CEP mini séminaire CCIN2P3, 13 mars 2015 Renaud Vernet
Introduction Contexte Budget computing ~ constant Grosses demandes de ressources LHC et Astroparticules notamment Peut-on accueillir tout le monde? Pré-requis : mesures sur les dernières années de nos coûts matériels nos consommations électriques Objectif Estimer un coût d'hebergement Ex : ressources de calcul d'une expérience, aujourd'hui et demain 2
Les grandes tendances Droite en échelle log = Evolution exponentielle c(t )= A e α t Evolutions technologiques IT souvent exponentielles On parle en «% par an» 3
Le matériel 4
Coût du CPU et DAS Récupération de l'historique des achats évolution du coût «unitaire» jusqu'aujourd'hui Cas «simples» 5
Que faire de ça? Comment utiliser cette évolution du prix? Tenir compte de la durée de vie du matériel (!) = «Renouvellement» Investissement (t) = Capacité (t) * Coût modelisé (t) HS06, TB / HS06, TB Coût matériel annuel qui intègre renouvellement 6
Coût modélisé du hardware Ceci est le coût modelisé Normalisé par les effets de renouvellement de matériel C'est avec ca que je peux faire des estimations simples pour le futur 7
L'électricité 8
Cout de l'électricité Evolution depuis 2004 Cout EDF difficile à prédire... Ajustement avec une courbe exponentielle + 5-10 % / an Possibilité ajustement linéaire 9
Consommation électrique par service Recupération de la consommation électrique totale du centre depuis plusieurs années 39 % CPU 41 % Disque 2 % Tape 18 % reste Incluant PUE vil1 & vil2 10
Consommation unitaire par type de ressource Consommation unitaire = Consommation ressource Capacité [kw / HS TB] [kw] [HS TB] Avec ça aussi je fais des estimations pour le futur 11
Et enfin... combien ca coûte? 12
Ce qu'il faut retenir On a maintenant les connaissances pour faire : Investissement (t) = Capacité (t) * Coût (t) ex. 21 Coût hard. model. + Coût élec. ex. 3 Hypothese Budget Constant CPU Disk Tape +25 % +18 % +38 % 13
Technique Code basé sur Python intégralement sous gitlab.in2p3.fr Récupération des données via Décisionnel + Lavoisier Affichage des résultats par Graphes sur pages web 14
Et aussi...... la petite interface web moche :) 15
Conclusions Projet bien avancé Beaucoup de données récuperées J'ai confiance en mes résultats :) Code disponible Accès à (presque) toutes les données est automatisé Décisionnel, lavoisier Comprendre coût HPSS très instructif Différence coût disk vs bande ~ consommation électrique (aujourd'hui) Il faut du disque qui consomme moins! Implications sur stratégie stockage expériences 16
A faire (si possible) Estimation des marges d'erreur Budget plat croissance optimiste vs pessimiste Scénario expérience donné Budget min vs max Integration coûts licenses HPSS OK Voir ce qui est faisable pour le reste (UGE, GPFS etc.) Electricité Récupération automatique Influence migration machines de Vil1 vers Vil2 Documentation En cours 17
Remerciements Rachid (discussions) Cyril L'O et Sylvain (Lavoisier) Foudil (Python) Pierre V, Philippe (web) Cécile (décisionnel) Xavier (électricité) PEM & Benoit (factures) Jean-Louis (EDF) 18
BACKUP 19
Coût de la bande Contrainte pour coût HPSS total 20
Coût de HPSS Cas «plutôt compliqué» Intégration des licenses, maintenance, lecteurs, librairies... HPSS investments 2000 1800 1600 1400 k 1200 1000 800 Achat de librairies lic./maint. hardware total 600 400 200 0 Maintenance/licenses ~ constant Achats matériel plus irrégulier 21