13 ноября 2011 г. 13:30 пользователь Руслан Зиганшин
<ziganshinrus...@gmail.com> написал:
> Оба раза после удара кулаком по клавиатуре. Где посмотреть логи (что
> же именно произошло) и что делать, чтобы этого не повторялось?
> Вариант "бережнее относиться к технике" не предлагать.

Однажды, понимал по каким причинам под легкой нагрузкой
двухпроцессорный сервер виснет. Дошел до анализа логов дампа ядра.
Интересность в том, что каждый раз ошибка разная была  ссылающаяся на
raid-контроллер, память. Глубокий анализ привел меня к документации
Intel на процессор, его инструкциям, битам ошибок. В моём случае
ошибка постоянно возникала на одном из двух процессоре, причем не
вешающая процессор, а приводящая всего лишь к его остановке. Ну да,
нестабильный процессор или обвязка вокруг него. Плюнул, работает так,
виснет раз в пол года, но работает уже годами.

Или другой случай. У товарища на числодробилке в ~200 хостов зависло
разом 16 хостов с паникой ядра. Хосты все как братья близнецы.
Спрашивается, с чего бы это?

Удар по клаве - что-то где-то у вас болтается в железе или дело в
звездах? Процессоры хоть со времен создания транзистора и стали
защищеннее от электромагнитного воздействия от солнца, но все равно
ему подвержены, поэтому я посматриваю порой на
http://spaceweather.com/. NASA сообщает, что аномально высокая
активность солнца, следуя своему 11 летнему циклу, идет на спад.

 =)

Ответить