[FRsAG] Les engagements sur la fiabilité du matériel

Alexandre Thu, 14 Apr 2016 04:54:07 -0700

Bonjour à tous,

je me permets de vous partager une mésaventure, cela permettra peut-êtreà certain de ne pas faire la même erreur que nous.

Nous avons eu un problème sur une baie de disque EMC vnx 5300. Suite àune opération programmée par EMC pour une mise à jour, le service à étéinterrompu sur la partie partage NFS/CIFS. Je ne vais pas rentrer dansles détails. Conclusion, après ouverture d'un ticket chez EMC, leservice n'a pu être rétabli que 9H plus tard.

L'origine du dysfonctionnement viendrait d'un groupe de disques quihébergeraient le "soft" des control station (CS), l'un des disquesaurait fait des problèmes d'écriture.


J'ai plusieurs problème avec ce discourt :

  - comment une baie blindée de disque puisse avoir ce type de problème ?

- comment ce type de problème n'a pas pu être détecté avant (s'il yen avait un) ?

- comment un procédure de mise à jour n'a pas détectée ce type deproblème (si la mise à jour est à l'origine du problème) ?


Côté EMC c'est très vague. Il y a deux affirmations :

1. La personne en charge du ticket incident, aurait du nous prévenir quel'opération serait longue, nous aurions pu basculer sur une autre infra.

2. EMC n'a pas de SLA, mais une SLO (service level objectives), qui demon point de vu désengage EMC de toutes responsabilité.

Pour finir, nous avons perdu beaucoup d'argent, et je pensemalheureusement que nous pourrons rien y faire.



Mes questions :

- Qu'aurions-nous du faire pour que EMC s'engage sur un taux dedisponibilité ? Tous les constructeurs fonctionnent-ils ainsi ?

- Il n'y a t'il pas des engagements sur le délais de rétablissementd'un service ?


  - Avez-vous eu un problème similaire dernièrement ?

Je ne cherche pas la polémique, il doit y avoir des gens de chez EMC. Jepartage juste un message officiel.


Merci par avance pour vos retours.

Alexandre.
_______________________________________________
Liste de diffusion du FRsAG
http://www.frsag.org/

[FRsAG] Les engagements sur la fiabilité du matériel

Répondre à