On Wed, 30 Jan 2008, Andrey Sinitsyn wrote:

Имеется кластер из четырех узлов.
Во всех узлах абсолютно одинаковое железо. По два проца AMD и по два
гига памяти. MB - Tyan TigerMPX
Винчестеров нет, все грузит по сети.

Системы для всех узлов абсолютно идентичны.

После обновления системы до Etch на одном из узлов начались совершенно
непонятные проблемы.
Вне зависимости от нагрузки в текущий момент может тупо зависнуть.
Намертво, не реагируя ни на клавиатуру, ни на пинги. В логах ничего...
Порой зависает на init'е при выполнения скрипта /etc/init.d/udev
Зависает на строчке "Wait for /dev to be fully populated...", но,
опять-таки через раз.
Какой-либо закономерности в зависаниях выявить не удалось. Т.е. она
может проработать двое суток, полностью загруженная и все в порядке. А
может зависнуть через 15 минут после перезагрузки...

Грешу на железо, но на какое? Чем можно комплексно протестировать все
железо?

Или, если я ошибаюсь, подскажите пожалуйста, в какую сторону думать :)


 Если железо аналогичное, поменяйте местами 1) память 2) процессор.
 По крайней мере достаточно быстро исключите их из
 списка подозреваемых.

 Успехов.
 Ю.

Ответить