J’explore plusieurs possibilités.
Mes clusters sont bien time-synced (un avec timesyncd, l’autre avec chrony),
donc je suis enclin à écarter cette piste.
Je prends une trace du traffic corosync (port 5405) pour tenter de détecter un
raté.
Merci
> Le 13 juin 2022 à 12:52, Francois Romieu a éc
Quand sur le 1er j’ai ça:
Jun 12 03:04:41 prox1-1 corosync[4379]: [KNET ] link: host: 2 link: 0 is down
Jun 12 03:04:41 prox1-1 corosync[4379]: [KNET ] host: host: 2 (passive) best
link: 0 (pri: 1)
Jun 12 03:04:41 prox1-1 corosync[4379]: [KNET ] host: host: 2 has no active
links
Jun 12
Bonjour,
David Ponzone :
[...]
> Je me demandais donc si je dois quand même chercher du côté d’un problème de
> transmission (donc perte d’un keepalive de temps en temps), ou si Coro peut
> avoir un petit bug dans ma version actuelle.
Perte, retard, fluctuation de la synchro horaire ou latence
Le Sun, Jun 12, 2022 at 07:28:59PM +0200, David Ponzone
[david.ponz...@gmail.com] a écrit:
> Proxmoxien(ne)s,
>
> J???ai 2 Proxmox en cluster (7.1.11, Coro 3.1.5-pve2) qui me font
> régulièrement (au moins une fois par jour) ceci:
>
> Jun 12 03:04:41 prox1-1 corosync[4379]: [KNET ] link: hos