Le 14/10/2021 à 11:07, Toussaint OTTAVI a écrit :
Erreur sur la route-map, tous les subnets internes se retrouvent
router vers l’anti-DDoS.
Cà veut dire qu'un seul mec sur un seul routeur peut changer sur une
seule instruction toutes les routes de la planète ? Bon, si j'ai bien
compris, c'est pas de bol, un phénomène en cascade, et une accumulation
de mauvaises routes qui a saturé tous les autres routeurs... Le truc
assez imprévisible tant qu'il ne s'est pas produit au moins une fois...
Aucun protocole de routage n'a implémenté de protection contre les
mauvaises annonces, ni les erreurs de configuration, ni les erreurs de
conception.
Il n'y a pas non plus de moyen pour un routeur de connaître l'état de
ces voisins (un truc comme "je suis momentanément surchargé, ne m'envoie
plus de trafic pour le moment", comme SS7 sait faire), c'est sans doute
plus facile à faire dans un réseau temporel et avec du routage statique
(qui se souvient du partage de charge en SS7) qu'en mode paquet.
Le réseau auto-magique qui se configure et se gère tout seul n'existe
pas (qui se souvient de la pub télé où cisco protège automatiquement des
attaques informatique ?).
--
Et le mec qui a fait la boulette, il ne s'en est pas aperçu de suite
pour revenir en arrière ? Même moi, à mon petit niveau, j'ai plein de
voyants "OVH" qui sont tous passés du vert au rouge en même temps...
Ou bien, c'est comme FB, il a perdu la main et n'avait pas d'OOB ?
La difficulté dans la résolution de problème c'est déjà d'identifier le
problème. Il y a tellement d'équipement, d'interdépendance d'éléments
(par exemple: BGP qui dépend d'OSPF qui dépend de BFD) qu'il est parfois
long d'identifier la root-cause. Là il y a sans doute des progrès à
faire sur des softs qui aiderait les ingé à trouver la root-cause plus
rapidement.
--
C'est pas encore Vendredi, mais entre çà, FB, les numéros d'urgence il y
a quelques mois, je suis assez pessimiste sur l'avenir de cette
civilisation hyper-connectée... Et encore, ce n'étaient que des
pannes/erreurs... Qu'est-ce que çà serait si des "puissances ennemies"
avaient la mauvaise idée de cyber-attaquer ???
Il y a bien d'autres cas où un évènement isolé se déclare, on pense que
les conséquences seront limitées et kaboum:
- expérimentation BGP qui a mal tournée:
https://labs.ripe.net/author/erik/ripe-ncc-and-duke-university-bgp-experiment/
- opération de maintenance classique sur une interco électrique:
https://fr.wikipedia.org/wiki/Panne_de_courant_du_4_novembre_2006_en_Europe
- arc électrique sur une ligne HT:
https://www.youtube.com/watch?v=-iSXF2lraR0&t=100s
Ca c'est pour les éléments documentés, mais je pense que ça existe aussi
dans l'économie, avec comme exemple les subprime et la cascade de faillites.
Mais on sait faire des choses très robuste en limitant l'environnement,
les interco et en augmentant la qualité (on fait la preuve mathématique
du code, multiplication des ordinateurs avec chacun du code différent,
processeur plus résistant à l'environnement ...):
- satellites;
- répéteurs des câbles sous-marins;
- les sondes (mars et ailleurs);
- centrales électriques, postes sources;
- ...
Globalement là où c'est économiquement plus pertinent d'avoir quelque
chose qui marche tout le temps plutôt que de subir les inconvénients de
subir un incident.
Faut-il en conclure que FB, OVH et tellement d'autre "peuvent se
permettre" d'avoir des incidents car ça coûterait encore plus cher de ne
pas les avoir ?
Pour conclure sur une note plus drôle, je ne pense pas que les pacemaker
ont suivi le même chemin que les sextoy qui sont devenus connectés:
https://www.lemonde.fr/pixels/article/2018/12/30/pirater-des-sextoys-connectes-une-partie-de-plaisir_5403696_4408996.html
--
Jérôme Marteaux
---------------------------
Liste de diffusion du FRnOG
http://www.frnog.org/