De Hannibal à StatFiP Récit d une migration réussie vers un serveur GRID Lorem Ipsum - 17/10/2016 1
Le bureau GF-3C Études statistiques en matière fiscale
Les missions du bureau GF-3C Le bureau GF-3C est en charge des études statistiques, des prévisions de recettes fiscales et effectue à ce titre des simulations à la demande du Cabinet du Ministre, du Parlement et de différentes institutions publiques ou privées. Il est également le service statistique ministériel de la DGFiP et répond aux demandes des chercheurs
Le bureau GF-3C Les compétences fonctionnelles
Compétences générales du bureau Acquisition des données et expertise Chiffrage et études fiscales GF-3C Diffusion de l information statistique Suivi conjoncturel et prévision des recettes fiscales Le bureau occupe une position stratégique, ses chiffrages étant indispensables à la prise de décision (réformes, arbitrages budgétaires). Le bureau étant également SSM, il diffuse de nombreuses statistiques vers les autres SSM.
4 sections de chiffrages Section 1 : analyse conjoncturelle et prévisions des recettes fiscales de l État, statistiques sur le recouvrement Section 2 : fiscalité directe locale (TH, TF, CFE, CVAE, ) Section 3 : fiscalité personnelle (IR, ISF, mutations à titre gratuit, ) Section 4 : fiscalité professionnelle (BIC/IS, BA, BNC, TVA, TS, )
Relations et liaisons En interne : Avec les autres services de la DGFiP et les autres directions du ministère En externe : Avec d autres administrations ou organismes institutionnels (Assemblée nationale, Sénat, Cour des comptes, organismes de Sécurité sociale, ), avec les entreprises et avec les chercheurs étrangers
Quelques réalisations (3) Fiscalité personnelle Étude de l impact des modifications de déclarations en cas de mariage, PACS ou divorce Simulation de la réforme du patrimoine Analyse des bénéficiaires du bouclier fiscal Constitution d échantillons représentatifs de redevables
Quelques réalisations (4) Fiscalité professionnelle Suivi du plan de relance (crédit d impôt recherche, carry-back, plans de règlements, crédit d'impôt pour la compétitivité et l'emploi, ) Simulation des effets de la mise en place de la «TVA groupe»
Les missions du bureau GF-3C : quelques chiffres clé Dans le cadre de ses principales missions institutionnelles, ce sont : 2 sites web intranet et internet 50 000 états fiscaux pour les collectivités locales hors simulations Plusieurs centaines de milliers de tableaux pour la révision de la fiscalité locale Plusieurs centaines de questions parlementaires Environ 1 900 études / prévisions pour 2013 Environ 1 200 études / prévisions pour 2014 Entre 100 et 200 To d échange d informations
Le système d information Le domaine de la section informatique
L ancienne architecture : vue globale Environnement UNIX Environnement bureautique et programmes SAS Environnement Windows Réseau DGFIP Serveur Windows 2003 phebus Contrôleur de Domaine Serveur Windows 2003 apollon Contrôleur de Domaine Serveur Windows 2003 helepole Serveur WEB
L ancienne architecture : vue UNIX le serveur Hannibal équipé de SAS 9.1 Serveur UNIX Hannibal HP RX 7620 Quadri processeurs Itanium 1,3 Ghz 32 Go de mémoire centrale 2 cartes réseaux 1 serveur SAS en mode natif (mode plateforme non installé) et serveur Enterprise Guide SAN (réseau de stockage) composé de (environ 40 To de surface disponible en RAID : 1 baie MSA60/MSA70 2 unités 2324FC 4 unités - baies MSA60/MSA70 96 disques de 300 Go en 2,5 pouces. 2 baies HP MSA30 de 28 disques de 73 Go chacune 1 baie autoraid HP avec module d extension de type VA7100 2 librairies Compaq MSL 5026 de 25 cartouches, reliées par un ascenseur et disposant d un lecteur SDLT 160/320 Logiciels d administration : Data Protector
La nouvelle architecture : les besoins exprimés et contraintes fixées par le commandement La plate-forme doit être constamment maintenue en haute disponibilité (une journée maximum par an d indisponibilité), en assurant la pérennité et la sanctuarisation des informations. Les performances doivent être sensiblement accrues pour faire face à des volumes d informations croissants et des demandes de plus en plus nombreuses et urgentes.
La nouvelle architecture : un choix réfléchi (1) Le prérequis : utilisation du logiciel SAS 9.4 Les alternatives : Hypothèse 1 : cluster physique actif / actif et SAS en mode plateforme Hypothèse 2 : cluster physique actif / passif et SAS en mode plateforme Hypothèse 3 : GRID avec 4 serveurs 16 nœuds
La nouvelle architecture : un choix réfléchi (2) Ce qui a emporté la décision de passer à un GRID plutôt qu à un serveur standard : La fonction haute disponibilité non présente dans un serveur standard La fonction d équilibrage de la charge Les fonctions intégrées de gestion des travaux Les fonctions de priorisation des travaux Les fonctions de point de reprise La possibilité de mutualiser sur nos connaissances sur SAS Foundation, SAS Enterprise Guide, d utiliser SAS/Studio
DÉMULTIPLIER LES RESSOURCES DE CALCUL Grid Computing Capacité Gestion de la charge de travail Bénéfice Gérer efficacement les traitements, les applications et les utilisateurs Haute disponibilité Empêcher l interruption de service Traitement distribué Améliorer la performance Tirer parti du matériel de commodité Réduire les coûts des infrastructures et des mises à niveau
La nouvelle architecture : le choix retenu Le nouveau serveur dispose : D une ferme de 4 serveurs IBM en architecture GRID avec SAS Business Analytics Framework De 39 stations de travail en Windows 7 pro 64 bits, équipées de SAS/Foundation et de SAS Enterprise Guide
La nouvelle architecture : les intervenants Décision : M. Parent (Directeur Général de la DGFiP) Porteurs du projet : Service de la Gestion Fiscale (aujourd hui M. LE BARON) Sous-direction GF-3 (aujourd hui M. EL KAROUI) Bureau GF-3C (aujourd hui M. LEPETIT) Architecture et maîtrise d ouvrage Bureau GF-3C (chef de projet : M. DULOUARD) SAS Institute Maîtrise d œuvre SI-2B (chef de projet : Mme MARTY) Hitachi, IBM Assistance externe MOE
La nouvelle architecture : l architecture technique
La nouvelle architecture : le respect du calendrier (1) L installation de la ferme de serveur a été terminée dans les délais (MOE 2I-2B, SAS) fin validée juillet 2015 L installation de SAS GRID a été réalisée dans les délais, les tests ont pu commencer en septembre 2015 (SAS) fin validée août 2015
La nouvelle architecture : le respect du calendrier (3) L installation des stations client SAS a été réalisée dans les délais (GF-3C) mars et avril 2016 Le déploiement a été achevé en totalité en mai 2016 Les principaux problèmes rencontrés : la sécurité du SSM vs. sécurité DGFiP et les problèmes de ports (LSF)
La nouvelle configuration : dans les faits (1) StatFiP Nombre de cœurs 16 cœurs répartis sur 4 serveurs Mémoire RAM 128 Go par serveur 32 Go Espace work (non batch) 800 Go par serveur sur SSD Hannibal 4 processeurs à 1 cœur 300 Go Stockage total 134 To (600 Mo/s max) 40 Go Nb de jobs concurrents testés Nb d utilisateurs pouvant travailler sur des travaux importants en même temps 100 jobs soumis, 72 traités, les autres en attente Entre 24 et 32 Entre 6 et 8 4 dans le meilleur des cas
La nouvelle configuration : dans les faits (2) Nombre d incidents bloquants Durée d exécution d une taxation d un échantillon d IR en monothreading Durée d exécution d une taxation d un fichier complet d IR en monothreading Durée d exécution d une taxation d un fichier complet d IR en multithreading (12 threads) StatFiP Hannibal 2 sur 3 mois 1 à 5 incidents par jour 15 minutes 9 heures 18 heures 7 jours de temps CPU 1 h 10 Effet de bord sur les autres utilisateurs impossible