On Mon, 2004-02-09 at 15:48, Jean-Francois Dive wrote: > Je parierais sur le couple carte_reseau/driver. > > il est concevable qu'un bug/probleme hardware soit survenu et que le > systeme aie survecu, mais je dois dire que c'est rare, mais possible. > si c'est une carte a base d'un chip broadcom, les chances augmentent > (hardware de mer..). Eu aussi des problèmes de ce genre avec le driver e1000 (Tyan, gigabit on board + 10/100, et j'ai vu broadcom). J'ai recompilé le driver ramené d'Intel, et je n'ai plus eu d'interruptions. Un autre problème qui semblait erratique était dû au remplissage complet de la Swap (grosse série de jobs exigeants en ram, en continu pendant des jours) : je ne sais pas si c'est propre à la génération du kernel (SuSE 8.2), mais c'était très efficace pour coincer la machine !
J'ai installé sar (system activity report) pour logger tout cela et analyser par après. > On Mon, Feb 09, 2004 at 03:07:16PM +0100, Alexandre Dulaunoy wrote: > > On Mon, 9 Feb 2004, R?mi Letot wrote: > > > > > Il y a quelques erreurs, mais au vu des conditions qui ont fait la loi > > > cette nuit, je n'en suis pas vraiment ?tonn?. > > > > C'est quoi le driver de la carte ? ton cable est du cat5 blind? ? > > > > > > > > > * Un second PC avec la m?me IP ? > > > > > > Impossible, c'est une connection directe via un c?ble crois?. > > > > Ok. > > > > > > * Un broadcast storm sur ce subnet ? > > > > > > C'est possible sur une liaison c?ble crois? saus autre machine sur le > > > subnet ? > > > > Non pas dans ce cadre. > > > > > > > > > * Un system de queueing sur le firewall ou entre les deux ? genre ALTQ > > > > ou autre ? > > > > > > C'est un simple firewall configur? avec shorewall. Il fait du DNAT pour > > > ce qui est destin? au serveur (le serveur est une DMZ r?duite ? sa plus > > > simple expression). Il n'y a aucune configuration particuli?re, juste un > > > firewall qui fait du NAT pour un r?seau local et une microDMZ. > > > > Le pool nat exhausted ? Un vilain client DoS sur la machine ? As-tu > > des logs sur ton firewall ? > > > > > > > > * ... il y a tellement de possibilit?s. > > > > > > Ben oui, c'est mon probl?me. Je suis pas un grand expert r?seaux, mais > > > je me d?brouille quand-m?me, et l? j'ai ?puis? toutes les causes > > > ?videntes. Dans un sens j'aurais pr?f?r? que le serveur soi encore en > > > rade ce matin pour pouvoir diagnostiquer ?a "? chaud". Mais l? j'ai un > > > serveur en parfaite sant?, simplement il a prouv? qu'il peut dispara?tre > > > sans crier gare et sans raison apparente. C'est un peu inconfortable :-) > > > > L'informatique: c'est souvent inconfortable. > > > > > > -- > > ** Alexandre Dulaunoy (adulau) **** http://www.foo.be/ **** 0x44E6CBCD > > **/ "To disable the Internet to save EMI and Disney is the moral > > **/ equivalent of burning down the library of Alexandria to ensure the > > **/ livelihood of monastic scribes." Jon Ippolito. > > > > > > > > _______________________________________________________ > > Linux Mailing List - http://www.unixtech.be > > Subscribe/Unsubscribe: http://www.unixtech.be/mailman/listinfo/linux > > Archives: http://www.mail-archive.com/[EMAIL PROTECTED] > > IRC: chat.unixtech.be:6667 - #unixtech -- ------------------------------------------------------------ Dr Alain Empain <[EMAIL PROTECTED]> <[EMAIL PROTECTED]> Bioinformatics, Molecular Genetics, Fac. Med. Vet., University of Liège, Belgium Bd de Colonster, B43 B-4000 Liège (Sart-Tilman) WORK: +32 4 366 3821 FAX: +32 4 366 4122 HOME: rue des Martyrs,7 B- 4550 Nandrin +32 85 51 23 41 GSM: +32 497 70 17 64 _______________________________________________________ Linux Mailing List - http://www.unixtech.be Subscribe/Unsubscribe: http://www.unixtech.be/mailman/listinfo/linux Archives: http://www.mail-archive.com/[EMAIL PROTECTED] IRC: chat.unixtech.be:6667 - #unixtech