ip_conntrack, límite de contadores, y kernel 2.4.24

2004-03-21 Por tema nmag only
Hola,

Necesito saber si alguien ha tenido un problema con el kernel
(específicamente las series 2.4) y si han tenido alguna solución, les
narro el asunto...

Tengo un servidor que hace de Router con Debian woody stable, gcc
2.95.4, kernel 2.4.24, procesador Intel Petium IV (dual), 512 RAM, NIC
D-Link. El kernel 2.4.24 usuado es el obtenido en kernel.org, lo que ya
he notado es que cada cierto tiempo (aproximadamente entre 8 a 10 días),
el equipo genera un mensaje:

Mar 17 10:13:23 blackmarsh kernel: LIST_DELETE: ip_conntrack_core.c:302
`ct-tuplehash[IP_CT_DIR_REPLY]'(ddf5c414) not in
ip_conntrack_hash[hr].

Después de ello queda completamente congelado y no hace nada, la única
solución es darle reset. Ahora esta situación ha ocurrido en tres
oportunidades y siempre ha sido justo cuando los contadores de
transmisión de paquetes TX o los contadores de recepción de paquetes RX
de la NIC estaban alcanzando el límite (un número bastante grande).

Como dato adicional el tráfico manejado por este equipo es bastante
grande. Por ahora tengo una solución por ortodoxa, y dado que el equipo
es rápido se reinicia una vez por semana, y con eso ese problema parece
haber desaparecido, pero no me parece lo más adecuado.

He estado investigando en internet sobre este problema específicamente
sobre ip_conntrack_core:302 (302, otros números ya han sido
solucionados) y hay poca información (y hacen alusión a un bug en el
kernel) y la poca información que hay es sobre consultas como esta de si
la nueva versión lo soluciona o si es necesario hacer un downgrade a la
2.4.22, había otra referida al kernel 2.4.23 y que persiste en la 2.4.24
por tanto no ha habido solución...

Ahora me queda la duda tengo adicionalmente otro servidor en debian
totalmente woody es decir con el kernel 2.4.18-bf24 y que hace un
trabajo similar y en este caso el trafico no es elevado, pero este
servidor hace como 3 meses genero un problema similar después de haber
estado trabajando por un lapso de 8 meses sin parar ahora nunca le di
importancia ya que el tiempo de trabajo fue extenso, pero por la
cantidad de meses me he puesto a pensar que los contadores también
habrían alcanzado el límite y el resultado habría sido el mismo...

El problema está en todas las series del kernel 2.4? por si acaso esto
ya lo he consultado en las listas vger.kernel.org y en kerneltrap pero
aun no hay respuesta...

Saludos y Gracias...

-- 
nmag only
gnupg 0xA024A03F [pgp.mit.edu]  GNU/Linux Registered User #312624



signature.asc
Description: Esta parte del mensaje =?ISO-8859-1?Q?est=E1?= firmada	digitalmente


Re: ip_conntrack, límite de contadores, y kernel 2.4.24

2004-03-21 Por tema Fernando M. Maresca
On Sun, Mar 21, 2004 at 09:38:26AM +, nmag only wrote:
 Hola,
 
 Necesito saber si alguien ha tenido un problema con el kernel
 (espec??ficamente las series 2.4) y si han tenido alguna soluci??n, les
 narro el asunto...
 
 Tengo un servidor que hace de Router con Debian woody stable, gcc
 2.95.4, kernel 2.4.24, procesador Intel Petium IV (dual), 512 RAM, NIC
 D-Link. El kernel 2.4.24 usuado es el obtenido en kernel.org, lo que ya
 he notado es que cada cierto tiempo (aproximadamente entre 8 a 10 d??as),
 el equipo genera un mensaje:
 
 Mar 17 10:13:23 blackmarsh kernel: LIST_DELETE: ip_conntrack_core.c:302
 `ct-tuplehash[IP_CT_DIR_REPLY]'(ddf5c414) not in
 ip_conntrack_hash[hr].
 
 Despu??s de ello queda completamente congelado y no hace nada, la ??nica
 soluci??n es darle reset. Ahora esta situaci??n ha ocurrido en tres
 oportunidades y siempre ha sido justo cuando los contadores de
 transmisi??n de paquetes TX o los contadores de recepci??n de paquetes RX
 de la NIC estaban alcanzando el l??mite (un n??mero bastante grande).
 
 Como dato adicional el tr??fico manejado por este equipo es bastante
 grande. Por ahora tengo una soluci??n por ortodoxa, y dado que el equipo
 es r??pido se reinicia una vez por semana, y con eso ese problema parece
 haber desaparecido, pero no me parece lo m??s adecuado.
 
 He estado investigando en internet sobre este problema espec??ficamente
 sobre ip_conntrack_core:302 (302, otros n??meros ya han sido
 solucionados) y hay poca informaci??n (y hacen alusi??n a un bug en el
 kernel) y la poca informaci??n que hay es sobre consultas como esta de si
 la nueva versi??n lo soluciona o si es necesario hacer un downgrade a la
 2.4.22, hab??a otra referida al kernel 2.4.23 y que persiste en la 2.4.24
 por tanto no ha habido soluci??n...
 
 Ahora me queda la duda tengo adicionalmente otro servidor en debian
 totalmente woody es decir con el kernel 2.4.18-bf24 y que hace un
 trabajo similar y en este caso el trafico no es elevado, pero este
 servidor hace como 3 meses genero un problema similar despu??s de haber
 estado trabajando por un lapso de 8 meses sin parar ahora nunca le di
 importancia ya que el tiempo de trabajo fue extenso, pero por la
 cantidad de meses me he puesto a pensar que los contadores tambi??n
 habr??an alcanzado el l??mite y el resultado habr??a sido el mismo...
 
 El problema est?? en todas las series del kernel 2.4? por si acaso esto
 ya lo he consultado en las listas vger.kernel.org y en kerneltrap pero
 aun no hay respuesta...
 
 Saludos y Gracias...
No te podría precisar el código del error, pero hace un tiempo, por usar
donkey, reconfiguré iptables y el router/fw  - 486 dx4, 48 MB, stable,
adsl 256/128 kb - empezó a quejarse de que se le llenaba la tabla de
conexiones, así que le levanté el número (por def. 1024) a 2048, creo, y
en seguida empezó a enfriarse que daba miedo: la rebooteaba y en menos de
24 hs. otra vez quieta.
No le encontré solución: deje de seguir la conexiones en los puertos con
tanto tráfico.
Por favor, comentá tus resultados.
Sds.

 
 -- 
 nmag only
 gnupg 0xA024A03F [pgp.mit.edu]  GNU/Linux Registered User #312624
 



-- 
Fernando M. Maresca

Cel: (54) 221 15 502 3938
Cel: 0221-15-502-3938