Bonjour,

Sur un serveur dédié chez OVH, sous Debian 9.4 qui fait tourner Proxmox
5.2-5 qui héberge 4 VM (toutes sous Linux aussi).
Régulièrement (au bout de quelques jours), le serveur plante, plus de
réponse au ping sur l'IP principale du serveur, d'où le déclenchement
d'un reset "Hard".

Évidemment j'essaye de trouver la cause de ce plantage.
Je n'ai rien trouvé du coté du disque dur (via smartctl).

Mais j'ai ceci dans le log "syslog". Lors du plantage, cette séquence a
débuté à 10h57 (heure du serveur qui est en UTC), à 11h03 j'ai perdu le
ping, elle a perdurée jusqu'à 11h08, heure du reboot par OVH.

Dec 17 11:02:33 cygnus kernel: [408638.686407] e1000e 0000:00:19.0 eno1:
Detected Hardware Unit Hang:
Dec 17 11:02:33 cygnus kernel: [408638.686407]   TDH                  <0>
Dec 17 11:02:33 cygnus kernel: [408638.686407]   TDT                  <2>
Dec 17 11:02:33 cygnus kernel: [408638.686407]   next_to_use          <2>
Dec 17 11:02:33 cygnus kernel: [408638.686407]   next_to_clean        <0>
Dec 17 11:02:33 cygnus kernel: [408638.686407] buffer_info[next_to_clean]:
Dec 17 11:02:33 cygnus kernel: [408638.686407]   time_stamp          
<10615a7a6>
Dec 17 11:02:33 cygnus kernel: [408638.686407]   next_to_watch        <0>
Dec 17 11:02:33 cygnus kernel: [408638.686407]   jiffies             
<10615b058>
Dec 17 11:02:33 cygnus kernel: [408638.686407]   next_to_watch.status <0>
Dec 17 11:02:33 cygnus kernel: [408638.686407] MAC Status            
<40080083>
Dec 17 11:02:33 cygnus kernel: [408638.686407] PHY Status             <796d>
Dec 17 11:02:33 cygnus kernel: [408638.686407] PHY 1000BASE-T Status  <3800>
Dec 17 11:02:33 cygnus kernel: [408638.686407] PHY Extended Status    <3000>
Dec 17 11:02:33 cygnus kernel: [408638.686407] PCI Status             <10>
Dec 17 11:02:33 cygnus systemd-networkd[924]: eno1: Lost carrier
Dec 17 11:02:33 cygnus kernel: [408638.849717] e1000e 0000:00:19.0 eno1:
Reset adapter unexpectedly
Dec 17 11:02:33 cygnus kernel: [408638.849756] vmbr0: port 1(eno1)
entered disabled state
Dec 17 11:02:37 cygnus systemd-networkd[924]: eno1: Gained carrier
Dec 17 11:02:37 cygnus systemd-networkd[924]: eno1: could not set
address: Permission denied
Dec 17 11:02:37 cygnus kernel: [408642.507741] e1000e: eno1 NIC Link is
Up 1000 Mbps Full Duplex, Flow Control: None
Dec 17 11:02:37 cygnus kernel: [408642.507786] vmbr0: port 1(eno1)
entered blocking state
Dec 17 11:02:37 cygnus kernel: [408642.507791] vmbr0: port 1(eno1)
entered forwarding state

Par contre, bien que je sois en train d'investiguer, j'ai bien compris
qu'un problème ce produit sur l'interface Ethernet, mais je ne sais pas
quoi précisément.
Avez vous une idée sur ce qui peut être à l'origine de ceci ?

PS : J'attends aussi une réponse d'OVH sur la question.

-- 
Alain JUPIN
Lumières d'Ici ... et d'Ailleurs <http://www.jupin.net>

Répondre à