Re: [ML] Re: [FRnOG] [ALERT] Gros problème OVH ?

2021-10-14 Par sujet Manuel Guesdon
On Thu, 14 Oct 2021 11:44:21 +0200
David Ponzone  wrote:

>| C’est fabuleux comme temps 30 min.
>| Chez Equinix, c’est 8h pour avoir un remote-hands.

Mauvaise langue :)

En remote hands pour incident, c'est a peu près du même ordre (mais faut
remplir la bonne demande, pas le remote hands standard).

Après ca ne remplace de toute façon jamais un accès autonome aux PDUs...

Manuel
--
__
Manuel Guesdon - OXYMIUM


---
Liste de diffusion du FRnOG
http://www.frnog.org/


Re: [ML] Re: [FRnOG] [ALERT] Gros problème OVH ?

2021-10-14 Par sujet Manuel Guesdon
On Thu, 14 Oct 2021 11:14:57 +0200
Renaud Chaput  wrote:
>| En gros la route-map était celle qui redistribuait BGP dans OSPF, et les
>| 850k routes de l'internet se sont retrouvées dans leur OSPF, ce qui a fait
>| exploser un peu tous les routeurs, et une grosse partie des routeurs se
>| sont mis à prendre le routeur en question comme default route.

Ca veut dire qu'au niveau design, on a un seul OSPF pour tout le réseau OVH ?

Avec de l'OSPF par site et des échanges inter-sites plutôt en BGP, avec donc
possibilité de filtrage à la fois en OUT sur un routeur et en IN sur le
routeur en face, ce genre de boulette n'aurait pas eu d'impact (global), non ?


>| Il n'y avait pas de staff OVH sur place, ils ont demandé au remote hands
>| local d'intervenir, déjà en débranchant tous les uplinks du routeurs, puis
>| au final en demandant à le débrancher électriquement. 10 minutes pour
>| décider de faire ça, puis 30 minutes avant que le remote hands ne soit sur
>| place, ça va encore.

D'où l’intérêt d'avoir un accès OOB complet  (serial over ssh + possibilité
de off/on/reboot à distance autonome via PDU).

Mais c'est clair que dans ce genre de situation les minutes passent très vite
(sauf celles ou on attend que l'intervenant arrive sur place, celles là sont
très très longues). Difficile de faire beaucoup beaucoup mieux en terme de
temps sur ce cycle décision-execution-convergence..

Manuel, qui retourne gérer son tout petit réseau :)

--
__
Manuel Guesdon - OXYMIUM


---
Liste de diffusion du FRnOG
http://www.frnog.org/