Référence Auteur Responsable de processus Processus: Gestion des Incidents G_09 Version 1.0 Fabienne MASSET et Philippe BOULANGER Thierry BERTRAND Date 31/03/2015 Statut Objet D Application Ce document fait partie du système documentaire qualité du DTIC L objectif du processus de Gestion des Incidents est de rétablir le fonctionnement normal du service aussi rapidement que possible et de réduire au minimum l impact défavorable sur le fonctionnement du business (clients et utilisateurs), assurant ainsi que les meilleurs niveaux possibles de qualité de service et de disponibilité sont maintenus. Le fonctionnement normal du service est défini comme le fonctionnement du service dans les limites du SLA ou la convention de services. Un Incident est défini comme Une interruption planifiée ou une dégradation de la qualité d un service informatique mais également comme Une défaillance d un élément de configuration n ayant pas encore impacté le service. Les premiers seront la plupart du temps déclarés par un utilisateur, les seconds par un outil de monitoring ou le personnel d exploitation. Etapes du processus Enregistrer la demande (Cfr. Processus d Exécution des Requêtes), Valider administrativement la demande (Cfr. Processus d Exécution des Requêtes), Catégoriser et prioriser, Investiguer et diagnostiquer, Résoudre et restaurer, Vérifier et accepter la solution, Clôturer. Glossaire: voir fin du document Dernière(s) modification(s): Version originale
Diagramme Heures de CIL Incident bureau? présent? clôturé Support Service Desk - Service Desk - 1er niveau Demandeur Spécialisé 2ème niveau CIL Utilisateur Constater un Dysfonctionnement Procédure de garde Investiguer et Diagnostiquer Déclarer un incident Déclarer Incident Demande d'intervention? Majeur? Catégoriser et Prioritiser Solution? Investiguer et Diagnostiquer Niveau? Investiguer et Diagnostiquer Résoudre et Restaurer Solution? Investiguer et Diagnostiquer Résoudre et Restaurer Solution? Résoudre et Restaurer Vérifier et Accepter la Solution accepté? Gestionnaire des Incidents Incident majeur Gestionnaire des Problèmes Gestion des problèmes Page: 2/8
Liste des actions par intervenant Demandeur Utilisateur Constater un Dysfonctionnement Un utilisateur constate un dysfonctionnement : S il ne parvient pas à revenir rapidement à la situation initiale, il contacte prioritairement son CIL, A défaut, il contacte le Service Desk. Le Service Desk est joignable entre 8h00 et 17h30 tous les jours ouvrables. En dehors de cette plage horaire, l utilisateur peut, à condition qu il dispose des prérogatives nécessaires, faire appel au service de garde (Cfr. Procédure de garde). Procédure de garde L'appel à la Garde sera décrit dans la procédure de Garde Déclarer un incident En l absence de son CIL, l utilisateur peut contacter le Service Desk : Téléphone : le 081/77.3000, Mail : servicedesk.dtic@spw.wallonie.be. Vérifier et Accepter la Solution L utilisateur est notifié par mail de la résolution de son incident. L incident est dans l état résolu. Si la solution proposée ne résout pas l incident (effet nul ou négatif sur la situation de l utilisateur), celui-ci peut alors demander la réouverture de l'incident, en en motivant la raison auprès du Service Desk. Pour ce faire, il dispose d un délai de 10 jours ouvrables à dater de la notification de résolution. CIL Investiguer et Diagnostiquer Le CIL analyse brièvement le dysfonctionnement signalé par l utilisateur. Il résout l incident immédiatement s il dispose des prérogatives nécessaires, si il contacte le Service Desk. Les incidents directement résolus par les CIL ne font l objet d aucun ticket. Page: 3/8
Déclarer Incident Si le CIL ne peut ou ne sait résoudre l incident, il contacte le Service Desk afin d initier un ticket : En se connectant au portail Web : http://helpdesk.spw.wallonie.be, Par téléphone : 081/77.3000, Par mail : servicedesk.dtic@spw.wallonie.be. Le CIL veille à communiquer de manière précise et exhaustive les informations relatives au dysfonctionnement rencontré de sorte que le Service Desk dispose de toutes les informations utiles à sa résolution. Service Desk - 1er niveau Catégoriser et Prioritiser La priorité d un incident est déterminée par son urgence et son impact. La priorité d un incident permet d identifier dans quel ordre les tickets doivent être traités par les équipes qui composent le Service Desk (Niveaux 1 et/ou supérieurs). En cas d incident majeur, les responsables informatiques 1 doivent être notifiés au moins à titre d information. Cette notification est de la responsabilité du Gestionnaire des Incidents (escalade hiérarchique). ------------------------- 1 Responsables de cellules DEX, responsables des Directions DAS-DEX- DSLP et Inspecteur Général DTIC. Page: 4/8
Investiguer et Diagnostiquer Le Service Desk de 1er niveau doit effectuer le diagnostic initial afin d essayer d identifier tous les symptômes de l incident et de déterminer exactement ce qui n a pas fonctionné et comment corriger. Si possible, l analyse du Service Desk de 1er niveau résoudra l incident pendant que l utilisateur est au téléphone et renseignera l incident comme résolu si la solution appliquée est approuvée par l utilisateur. Si le Service Desk de 1er niveau ne peut résoudre l incident pendant que l utilisateur est au téléphone, mais qu il pourra le faire dans un délai convenu sans l aide d autres groupes de support, l opérateur du Service Desk en informera l utilisateur, lui communiquera le numéro de référence de son ticket. Dès qu il apparaîtra clairement que le Service Desk de 1er niveau ne peut pas résoudre l incident lui-même, il transfère le ticket au(x) niveau(x) de support supérieur(s) (escalade fonctionnelle) : Si le Service Desk identifie que le deuxième niveau de support peut résoudre l incident, il lui transfère le ticket, S il est évident que l incident aura besoin de connaissances techniques approfondies, l incident est immédiatement escaladé au groupe de support compétent spécialisé. Le Service Desk effectuera également une escalade hiérarchique auprès du Gestionnaire d Incidents s il constate que les étapes Investiguer et Diagnostiquer et/ou Résoudre et Restaurer s avèrent trop longues ou s il y a controverse sur l allocation de l incident. Ce type d escalade peut également être déclenché par les utilisateurs ou leur responsable. NOTE : Indépendamment de l activité où l on se trouve dans le cycle de vie de l incident, la propriété de l incident demeure en permanence attribuée au Service Desk de 1er niveau. Il conserve par conséquent la responsabilité du suivi de l avancement, de l information des utilisateurs et finalement de la résolution de l incident. Résoudre et Restaurer Quand la résolution potentielle est identifiée, le Service Desk de 1 er niveau applique la solution et la teste avec l utilisateur. Indépendamment des actions menées, ou de qui les réalise, l enregistrement de l incident est mis à jour en conséquence avec les informations pertinentes et l ensemble des détails de sorte qu un historique complet soit maintenu. Page: 5/8
Service Desk - 2ème niveau Investiguer et Diagnostiquer L incident est pris en charge par le Service Desk de 2 ème poursuit l investigation entamée par le 1 er niveau. niveau et Si le 2 ème niveau ne peut résoudre l incident, il en informe le Service Desk s il estime que la résolution de l incident incombe à un groupe de support spécialisé externe ou assigne directement l incident à un groupe de support spécialisé interne. En cas d erreur d assignation, le Service Desk de 2 ème niveau en informe le Service Desk de 1 er niveau et lui réaffecte le ticket d incident. Résoudre et Restaurer Quand la résolution potentielle est identifiée, le Service Desk de 2 er niveau applique la solution et la teste avec l utilisateur. Indépendamment des actions menées, ou de qui les réalise, l enregistrement de l incident est mis à jour en conséquence avec les informations pertinentes et l ensemble des détails de sorte qu un historique complet soit maintenu. Support Spécialisé Investiguer et Diagnostiquer Le groupe de support spécialisé poursuit l investigation entamée par les niveaux de support précédent. Résoudre et Restaurer Quand la résolution potentielle est identifiée, le groupe de support spécialisé applique la solution et la teste avec l utilisateur. Indépendamment des actions menées, ou de qui les réalise, l enregistrement de l incident est mis à jour en conséquence avec les informations pertinentes et l ensemble des détails de sorte qu un historique complet soit maintenu. Gestionnaire des Incidents Incident majeur La gestion d'un Incident Majeur sera décrite dans la procédure Gestion des Incidents Majeurs Gestionnaire des Problèmes Gestion des problèmes La gestion des Problèmes sera décrite dans la procédure G_10 Gestion des Problèmes. Page: 6/8
Informations complémentaires Définition de l Urgence d un Incident Urgence Définition 1 Haute Evènement bloquant : le service doit être restauré au plus vite 2 Moyenne 3 Basse Evènement bloquant, perte partielle de fonctionnalité : l'incident ne doit pas être résolu immédiatement Evènement bloquant, perte de fonctionnalité accessoire : la résolution de l'incident peut attendre Définition de l Impact d un Incident Impact Degré d'indisponibilité 1 Haut Interruption complète d'un service, d'un système, du réseau, d'une application ou d'un élément de configuration identifié comme critique ou >100 utilisateurs concernés ou VIP 2 Moyen S'applique lorsque le service, le système, le réseau, l'application ou l'élément de configuration peut procéder mais dont la performance est considérablement réduite et/ou les fonctionnalités sont très limitées ou >10 et <100 utilisateurs concernés 3 Bas Un événement qui provoque la perte minime d'un service. Une solution permanente ou de contournement est disponible pour restaurer la fonctionnalité du service. Cet évènement n'empêche en rien l'utilisateur de travailler ou <10 utilisateurs concernés Définition de la Priorité d un Incident Urgence Priorité 1 2 3 Impact 1 1 1 2 2 1 2 3 3 2 3 3 Priorité Délai de remise en service 1 Haute Action immédiate: le SD prévient l'incident Manager et s'assure qu'il a pris en charge l'incident 2 Moyenne Action endéans l'heure: le SD s'assure que l'équipe assignée a bien pris en charge l'incident 3 Basse Action endéans les 24h : le SD s'assure que l'équipe assignée a bien pris en charge l'incident Page: 7/8
Glossaire Terme CIL Priorité d'un incident SPW Définition Coordinateur Informatique Local La priorité des incidents est déterminée par leur urgence et leur impact Service public de Wallonie Page: 8/8