On 22/07/2021 14:54, Xavier Beaudouin via frnog wrote:
Bref... Si techniquement orange n'est pas trop le fautif...
Le rapport pointe tout de même des manquements techniques :
– p.4 : « Plus généralement, l’absence de traitement ou de supervision
spécifiques pour les numéros d’urgence est étonnante et elle explique
largement les ralentissements dans l’identification de l’origine du
dysfonctionnement et de ses impacts. » (-> ce sont les services
d'urgence qui ont alerté sur le problème, en constatant une baisse
anormale du volume de communications)
– pp. 21 et 22 : « L’exécution de la première instruction a mis
l’ensemble des call servers dans un état qui a déclenché un bogue
logiciel. En effet, cette instruction rouvrait une route pour laquelle
il n’existait pas de sortie possible pour les appels. Les appels se sont
alors accumulés dans la mémoire du call server sans pouvoir être libérés
et c’est cette situation qui a déclenché le bogue. Les call servers sont
alors entrés dans une boucle de redémarrage régulière et n’étaient plus
administrables. Le passage de la commande suivante qui visait à ouvrir
une sortie n’était plus accepté.L’ordre d’exécution des commandes est
manifestement une erreur d’Orange. Même en l’absence de bogue logiciel
l’exécution de la commande d’ouverture d’une route sans ouverture d’une
sortie aurait conduit à des appels en échecs. » (-> et cette première
instruction a été passée sur _tous_ les call servers)
Sur l'organisation :
– Il s'est passé deux heures entre la déclaration à Orange de l'incident
(par le SAMU Nord) et la mise en place d'une cellule de crise managériale
– Puis encore une heure avant la première réunion de cette cellule de
crise (!)
– p. 26 : « D’ailleurs, lors des auditions des responsables d’Orange, il
a été indiqué à la mission que « la décision d’activer le dispositif de
crise n’avait pas été déclenchée par la remontée d’alerte de services
d’urgences mais par la dégradation du trafic sur l’interconnexion IP/RTC
qui concernait tous les numéros ». Cette situation explique la réaction
spontanée d’un représentant d’Orange durant une réunion du centre
interministériel de crise (CIC) indiquant « que des entreprises aussi
ont été touchées », remarque perçue par certains comme l’indice d’une
absence de prise en considération du caractère d’urgence vitale qui
était lié à cette crise. »
---------------------------
Liste de diffusion du FRnOG
http://www.frnog.org/