Re: [FRnOG] [TECH] Juniper et reboot violent

2019-03-12 Par sujet Pierre Emeriaud
Le mar. 12 mars 2019 à 12:33, Arnaud Launay  a écrit :
>
> watchdog: scheduling fairness gone. Too much high-priority workload!
> watchdog: scheduling fairness gone for 20 seconds now.
>
> et ça continue jusqu'à atteindre 3600 secondes, où il reboot (enfin).
>
> J'ai demandé à nos amis du JTAC s'il y avait moyen de baisser
> cette durée pour quelque chose d'autre, mais ils ne comprennent
> visiblement pas la question.

je ne sais pas s'il s'agit du même watchdog,  mais dans la cli il y a :

moi@router# set system processes watchdog timeout ?
Possible completions:
  Watchdog timer value (1..3600 seconds)

moi@router# set system processes watchdog enable
moi@router# set system processes watchdog timeout 300

ça passe le commit check sur un mx960/re1800x4/17.4R2, mais j'ai pas
planté volontairement pour voir si ça fonctionnait bien.

il y avait 'set system debugger-on-break' sinon qui pouvait aider,
mais il fallait pouvoir envoyer rapidement un break sur la console (ça
drop dans ddb). pour du lab c'est pratique. et de toute façon ça
disparait dans les junos récents.

Et pour le problème sous-jacent, regarde PR108.


---
Liste de diffusion du FRnOG
http://www.frnog.org/


[FRnOG] [TECH] Juniper et reboot violent

2019-03-12 Par sujet Arnaud Launay
Bonjour,

Une petite question technique pour changer...

Sur un Juniper MX5, j'ai eu le cas plusieurs fois ces derniers
temps d'un reboot en mode panic / dump / argh (ça aime pas le
730k routes, bon, on y travaille), par contre, ensuite on a droit
à ça:

watchdog: scheduling fairness gone. Too much high-priority workload!
watchdog: scheduling fairness gone for 20 seconds now.

et ça continue jusqu'à atteindre 3600 secondes, où il reboot (enfin).

J'ai demandé à nos amis du JTAC s'il y avait moyen de baisser
cette durée pour quelque chose d'autre, mais ils ne comprennent
visiblement pas la question.

Du coup, est-ce que quelqu'un aurait une idée ? Jusqu'ici la
méthode la plus rapide que j'ai trouvé a été de le débrancher
électriquement, ce qui est quand même un peu triste...
J'aimerais bien qu'au bout de, mettons, 300 secondes par exemple,
il reboote tranquillement tout seul. Impossible dans la doc de
trouver comment régler ce watchdog.

Arnaud.


---
Liste de diffusion du FRnOG
http://www.frnog.org/