Active Directory et les niveaux de service : sources de stress et d’angoisse?
Vous souffrez d’insomnie? Vous vous réveillez en sueur au milieu de la nuit, assailli de tourments incessants?
Si oui, avez-vous déjà pensé que votre malheur pourrait être lié à ce doute persistant à savoir si votre environnement Active Directory est bien en ordre? Vous êtes conscients qu’Active Directory est un service essentiel à votre organisation, et qu’une grande partie de votre activité en dépend. Cela dit, vous ne disposez pas d’un plan de reprise après sinistre qui a fait ses preuves, et vous n’avez jamais vraiment songé aux niveaux de service.
Maintenant que j’ai toute votre attention, j’aimerais vous offrir quelques conseils utiles pour améliorer votre situation… qui vous aideront peut-être aussi à mieux dormir!
Planification du plan de reprise après sinistre pour Active Directory
Il existe une citation d’affaires bien connue en anglais : « the only thing harder than planning for an emergency is explaining why you didn’t » (la seule chose qui est plus difficile que de planifier une situation d’urgence, c’est d’expliquer pourquoi on ne l’a pas fait).
Vous avez sans doute déjà entendu cette devise, et elle contient beaucoup de vrai. Hélas, bon nombre de gens l’ont appris à leurs dépens. Cette affirmation laisse entendre que la reprise des activités après sinistre est une tâche très lourde et laborieuse, mais avec la bonne approche, ce n’est pas forcément le cas. Planifier une reprise après sinistre, et, plus précisément, une reprise de votre environnement Active Directory, ne devrait pas être source de découragement.
De nombreux incidents touchant Active Directory peuvent nuire à votre entreprise : panne d’un contrôleur de domaine, suppression ou modification accidentelle d’un grand nombre d’objets et d’attributs, panne d’un domaine ou panne touchant l’ensemble de la forêt. Afin de vous aider à saisir pourquoi votre organisation a besoin d’assurer la haute disponibilité de son environnement Active Directory et de mettre en place des processus reprise après sinistre performants, posez-vous la question suivante : quelles seraient les conséquences pour votre organisation, en tenant compte de vos coûts et de votre réputation, si vous deviez cesser vos activités pour 12 heures, 24 heures, ou plus? Il est rare qu’une panne Active Directory d’une telle durée soit acceptable.
Voici trois questions cruciales auxquelles toute entreprise doit répondre lors de la planification de stratégies de sauvegarde et de reprise pour Active Directory.
- Quel est mon objectif de point de rétablissement? L’objectif de point de rétablissement (en anglais RPO pour « recovery point objective ») se définit comme le délai maximal acceptable durant lequel des données peuvent être perdues. Si votre RPO est de 12 heures, alors vos sauvegardes devraient avoir lieu au moins toutes les 12 heures.
- Quel est mon objectif de délai de rétablissement? L’objectif de délai de rétablissement (en anglais RTO pour « recovery time objective ») représente le délai pour rétablir les données à la suite d’une catastrophe afin d’éviter des conséquences inacceptables liées à l’interruption des services.
- Quelle est la période de conservation de vos données sauvegardées? En d’autres mots, vous devez conserver des données qui remontent jusqu’à quand? Cette période doit être inférieure à la période de pierre tombale (« tombstone lifetime ») définie dans Active Directory. Cette période peut dépendre de différents facteurs, comme des exigences légales ou d’autres contraintes. Quelle qu’en soit la longueur, il importe que cette période soit définie et convenue de manière formelle.
Vos réponses à ces questions pourront également justifier une demande pour de nouveaux outils, solutions de stockage et infrastructures afin de répondre aux besoins de votre organisation.
Une des premières règles de la sauvegarde est la redondance. Il est donc important que votre plan de sauvegarde et de reprise n’ait pas de point de défaillance unique, qu’il s’agisse d’un site, d’un dispositif de stockage pour vos données sauvegardées ou d’un contrôleur de domaine. Sauvegardez les données de plusieurs contrôleurs de domaine à partir de différents emplacements physiques, et assurez-vous d’avoir au moins un contrôleur de domaine physique par domaine. Vous devrez peut-être déterminer quels contrôleurs de domaine constitueront les points de contrôle pour la reprise, ce qui peut vous demander de revoir votre topologie Active Directory ainsi que le placement de vos données sauvegardées.
Gestion proactive de la reprise après sinistre
Les plans et processus de reprise après sinistre ne devraient jamais être statiques ou réactifs. En plus d’être proactifs, ils doivent continuellement faire l’objet d’améliorations, de tests et de processus de mise au point. Si vous n’avez jamais testé votre plan de reprise, vous n’êtes pas prêt à gérer adéquatement une vraie catastrophe, un point c’est tout.
En compilant et en effectuant une sélection de tests trimestriels et annuels, vous renforcerez la confiance de votre organisation quant à sa capacité à affronter une situation d’urgence. En plus de valider les aspects techniques du processus de reprise, les tests réguliers confirment que les sauvegardes fonctionnent comme prévu. Qui plus est, cela aide votre organisation à mettre au point d’autres processus que vous devrez suivre en situation d’urgence.
Bien sûr, vous devez faire un suivi de vos sauvegardes pour vous assurer qu’elles sont bien effectuées et qu’elles se déroulent conformément à l’échéancier établi.
L’étape suivante : les niveaux de service
Une fois que vous avez mis en place une solution de sauvegarde qui a fait ses preuves et qui répond aux besoins de votre organisation, faites un pas de plus en définissant des niveaux de service et en parvenant à une entente pour ceux-ci au sein de votre organisation. Les niveaux de service mesurent la performance d’un système en déterminant si celui-ci atteint certains objectifs, et dans quelle mesure. Si vous n’avez pas encore adopté la gestion des services de TI et les niveaux de service, pourquoi ne pas donner une longueur d’avance à votre entreprise? À long terme, vous en bénéficierez grandement.
Discuter des niveaux de service et arriver à une entente autour de ceux-ci constitue une manière saine d’approcher la reprise après siniste. Il faut poser certaines questions et arriver à une entente pour éliminer toute ambigüité à l’égard du service et des temps de reprise advenant une catastrophe. Ainsi, vous vous assurerez que toutes les personnes ont les mêmes attentes et sont sur la même longueur d’onde.
En cas de catastrophe, les gens connaîtront les délais de reprise prévus. Il est beaucoup facile d’assurer la disponibilité d’Active Directory sous la forme d’un pourcentage si vous disposez d’un plan de reprise bien préparé et rigoureusement testé.
Retrouvez le sommeil
Afin d’éviter les pannes d’Active Directory et les pertes de productivité qui en découlent, donnez-vous comme priorité d’élaborer un plan de reprise après sinistre efficace cette année, et assurez-vous que celui-ci soit régulièrement testé, revu et amélioré. Il est possible d’offrir des niveaux de service pour Active Directory dans ces circonstances. Si vous suivez ces conseils, votre entreprise se portera mieux… et vous pourrez dormir en paix!
Si vous vous sentez concernés par le contenu de ce billet ou que vous souhaitez en discuter plus en détail, n’hésitez pas à entrer en contact.