Bonjour,

(désolé j'ai plus le message-id, j'ai trouvé le mail sur les archives)


> sur l'ensemble de mes serveurs Dell, j'ai 9 serveurs R410 en production depuis
> plusieurs mois. 4 ont planté lamentablement dans le mois d'octobre, de manière
> aléatoire.
> 
> Rien dans les logs, le serveur reboot et stop juste après le BIOS sur le 
> message
> "System fatal error - press F1 to continue or F2 for setup".
> Un diagnostique Dell donne ces erreurs :
> 
>     Critical interrupt sensor (PCIE Fatal Err) Bus Fatal Error
>     Processor sensor (CPU Machine Chk) transition to non-recoverable
> 
> 
> Je suis en contact avec Dell, ai envoyé pas mal de logs et de rapports DSET,
> mais pour l'instant ils n'ont pas de piste, le bug est "escaladé"...
> 
> La seule chose que j'ai faite après avoir supprimé les logs IPMI, c'est de
> mettre à jour le BIOS en 1.8.2, depuis pas d'erreurs, mais comme ça faisait 
> déjà
> plusieurs mois qu'ils tournaient sans problème, ce "bug" peut potentiellement
> revenir ...

As tu plus d'infos aujourd'hui ? L'upgrade de Bios a t-elle aidée ? Ou pas ?

J'ai ce problème sur un R620 (j'en suis à 3 reboots) alors que son petit frère
qui a le même workload n'a pas encore rebooté...

Merci,

-- 
Seb
_______________________________________________
Liste de diffusion du FRsAG
http://www.frsag.org/

Répondre à