История проблемы:
У одного из западных провайдеров был куплен колокейшн вместе с машинкой.
Провайдер сам водрузил туда woody. 
Этот woody сразу был сапгрейжен до testing.

Проблемы начались практически сразу. Машинка висла сама, программы падали с 
сегфаултом,
ядро компилилось через раз.
Провайдер заменил ВСЕ железо кроме жесткого диска (как они утверждают). 
Однако больше 2-х суток машинка все-равно не живет и в dmesg сообщения вот 
такого рода.

Unable to handle kernel NULL pointer dereference at virtual address 00000000
 printing eip:
c01403b8
*pde = 00000000
Oops: 0000
CPU:    0
EIP:    0010:[d_lookup+92/244]    Not tainted
EFLAGS: 00010203
eax: c1ffe650   ebx: fffffff0   ecx: 00000011   edx: 135346f6
esi: 00000000   edi: dfb63fa4   ebp: 00000000   esp: dfb63f14
ds: 0018   es: 0018   ss: 0018
Process spamd (pid: 4949, stackpage=dfb63000)
Stack: dfb63f74 00000000 dfb63fa4 f6829b80 c1ffe650 f081e005 135346f6 00000005 
       c0138192 f6aa69e0 dfb63f74 dfb63f74 c0138531 f6aa69e0 dfb63f74 00000004 
       f081e000 00000000 dfb63fa4 00000009 c0137fae 00000009 f081e00b 00000000 
Call Trace: [cached_lookup+14/80] [link_path_walk+457/1720] [getname+94/156] 
[path_walk+26/28] [__user_walk+53/80] 
   [sys_stat64+25/112] [sys_open+104/148] [system_call+51/56] 

Code: 8b 6d 00 8b 54 24 18 39 53 44 75 74 8b 44 24 24 39 43 0c 75 
 <1>Unable to handle kernel NULL pointer dereference at virtual address 00000008
 printing eip:
c012f74b
*pde = 00000000
Oops: 0000
CPU:    0
EIP:    0010:[dentry_open+51/388]    Not tainted
EFLAGS: 00010202
eax: f13f1001   ebx: ec6e2270   ecx: 00000000   edx: 00000000
esi: f13f1000   edi: 4004dd14   ebp: bffff6b8   esp: dd995f88
ds: 0018   es: 0018   ss: 0018
Process apache (pid: 13087, stackpage=dd995000)
Stack: 0000000b efdf6740 c1e0f2d0 4004dd14 bffff6b8 00000000 00000001 00000001 
       c012fa37 f13f1000 00008000 00000000 dd994000 00008000 c0106d7b 08c11048 
       00008000 00000000 00008000 4004dd14 bffff6b8 00000005 0000002b 0000002b 
Call Trace: [sys_open+51/148] [system_call+51/56] 

Code: 8b 72 08 a8 02 74 13 56 e8 b4 89 00 00 89 c7 83 c4 04 85 ff 


Отключение swap делу не помогло. Хотя теперь сообщения несколько другие, чем 
было до замены железа. 
Там в основном были сообщения типа kernel BUG in tralala.c:xxx.

Ядра применялись и скомпиленные под эту машинку и из дистрибутива 
(2.4.18-bf2.4). Эффект один и тот же.
Компиляция ядра проходит через раз. Причем чем дольше машинка работает, тем 
меньше шансов что ядро соберется.
Абсолютно точно ядро не собирается если параллельно запустить что-то типа dd 
if=/dev/sda1 of=/dev/null.

Что можете посоветовать? Я уже устал придумывать :)

-- 
Nick Potemkin
Eniro Rus-M
http://www.eniro-m.ru
::: Yellow Pages Moscow
http://www.yellowpages.ru
phone: +7 (095) 799-55-55
fax:      +7 (095) 799-55-09 

Ответить