INFO: task apache2:5389 blocked for more than 120 seconds

2011-09-26 Por tema Sergio Villalba
Muy buenas a todos,

Este fin de semana he tenido caídas en el servicio Web y la verdad que
este mañana nos hemos dado cuenta del problema(será necesario
configurar bien el Pandora FMS).

El servidor Apache estaba detenido y en los logs del kernel aparecen
estos mensajes:

Sep 24 03:27:10 web kernel: [5160670.759468] INFO: task apache2:5429
blocked for more than 120 seconds.

Sep 24 03:27:10 web kernel: [5160670.761501] echo 0 
/proc/sys/kernel/hung_task_timeout_secs disables this message.

Sep 24 03:27:10 web kernel: [5160670.761796] apache2   D f6461e0c
   0  5429   6529 0x

Sep 24 03:27:10 web kernel: [5160670.761995]  f04ab740 00200082
f6461ccc f6461e0c f6461e10 c1419100 c1419100 c14146ac

Sep 24 03:27:10 web kernel: [5160670.762078]  f04ab8fc c2a08100
0001 048a 0041 c13b13c0 c108af35 1d36

Sep 24 03:27:10 web kernel: [5160670.762088]  c2a036ac f04ab8fc
4cf68992  0d4bcc4a   

Sep 24 03:27:10 web kernel: [5160670.762163] Call Trace:

Sep 24 03:27:10 web kernel: [5160670.763072]  [c108af35] ?
zone_watermark_ok+0x16/0x99

Sep 24 03:27:10 web kernel: [5160670.763104]  [c126d54a] ?
io_schedule+0x5f/0x98

Sep 24 03:27:10 web kernel: [5160670.763700]  [f839b6ba] ?
nfs_wait_bit_uninterruptible+0x5/0x8 [nfs]

Sep 24 03:27:10 web kernel: [5160670.763710]  [c126d9d1] ?
__wait_on_bit+0x33/0x58

Sep 24 03:27:10 web kernel: [5160670.763731]  [f839b6b5] ?
nfs_wait_bit_uninterruptible+0x0/0x8 [nfs]

Sep 24 03:27:10 web kernel: [5160670.763738]  [c126daab] ?
out_of_line_wait_on_bit+0xb5/0xbd

Sep 24 03:27:10 web kernel: [5160670.763755]  [f839b6b5] ?
nfs_wait_bit_uninterruptible+0x0/0x8 [nfs]

Sep 24 03:27:10 web kernel: [5160670.763770]  [c1044067] ?
wake_bit_function+0x0/0x3c

Sep 24 03:27:10 web kernel: [5160670.763788]  [f839b6af] ?
nfs_wait_on_request+0x19/0x1f [nfs]

Sep 24 03:27:10 web kernel: [5160670.763805]  [f839f26f] ?
nfs_updatepage+0x1a0/0x4b1 [nfs]

Sep 24 03:27:10 web kernel: [5160670.763821]  [f839f5ae] ?
nfs_flush_incompatible+0x2e/0x4a [nfs]

Sep 24 03:27:10 web kernel: [5160670.763836]  [f83937c9] ?
nfs_write_end+0x104/0x12d [nfs]

Sep 24 03:27:10 web kernel: [5160670.763856]  [c108841e] ?
generic_file_buffered_write+0x12f/0x21d

Sep 24 03:27:10 web kernel: [5160670.763864]  [c1088909] ?
__generic_file_aio_write+0x265/0x28d

Sep 24 03:27:10 web kernel: [5160670.763875]  [c11ceb27] ?
sock_common_recvmsg+0x2f/0x45

Sep 24 03:27:10 web kernel: [5160670.763881]  [c11ccef0] ?
__sock_recvmsg+0x50/0x58

Sep 24 03:27:10 web kernel: [5160670.763945]  [c1088982] ?
generic_file_aio_write+0x51/0x93

Sep 24 03:27:10 web kernel: [5160670.763968]  [f83941f3] ?
nfs_file_write+0xf5/0x159 [nfs]

Sep 24 03:27:10 web kernel: [5160670.763984]  [c10b314e] ?
do_sync_write+0xc0/0x107

Sep 24 03:27:10 web kernel: [5160670.763997]  [c104403a] ?
autoremove_wake_function+0x0/0x2d

Sep 24 03:27:10 web kernel: [5160670.764014]  [c1033d67] ?
do_setitimer+0x1be/0x1d0

Sep 24 03:27:10 web kernel: [5160670.764030]  [c11027e0] ?
security_file_permission+0xc/0xd

Sep 24 03:27:10 web kernel: [5160670.764041]  [c10b308e] ?
do_sync_write+0x0/0x107

Sep 24 03:27:10 web kernel: [5160670.764051]  [c10b3a58] ? vfs_write+0x7e/0xd6

Sep 24 03:27:10 web kernel: [5160670.764061]  [c10b3b48] ? sys_write+0x3c/0x63

Sep 24 03:27:10 web kernel: [5160670.764073]  [c10030fb] ?
sysenter_do_call+0x12/0x28

Datos:

Debian  6.0.2

uname -a
Linux web 2.6.32-5-686 #1 SMP Mon Jun 13 04:13:06 UTC 2011 i686 GNU/Linux

Los logs de Apache son almacenado en un servidor NFS en nuestra red
local, ¿estos mensajes están relacionado con eso?

La configuración de Apache es la siguiente:

Timeout 1800

KeepAlive On

MaxKeepAliveRequests 1000

DumpIOInput On
DumpIOLogLevel debug

IfModule mpm_prefork_module
    StartServers 20
    MinSpareServers  10
    MaxSpareServers  10
    MaxClients  150
    MaxRequestsPerChild   1
/IfModule

IfModule mpm_event_module
    StartServers  2
    MaxClients  150
    MinSpareThreads  25
    MaxSpareThreads  75
    ThreadLimit  64
    ThreadsPerChild  25
    MaxRequestsPerChild   0
/IfModule

User ${APACHE_RUN_USER}
Group ${APACHE_RUN_GROUP}

¿Alguien me puede dar alguna pista?

Ahora mismo tengo el servicio funcionando porque he reiniciado el Apache.

Gracias, un saludo.


--
To UNSUBSCRIBE, email to debian-user-spanish-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive: 
http://lists.debian.org/ca+ylrtcsau8__o3rqnqzegxfrgthhvnf61t+fd_v-p2dpkx...@mail.gmail.com



Re: INFO: task apache2:5389 blocked for more than 120 seconds

2011-09-26 Por tema Juan Antonio
El 26/09/11 09:08, Sergio Villalba escribió:
 Muy buenas a todos,

 Este fin de semana he tenido caídas en el servicio Web y la verdad que
 este mañana nos hemos dado cuenta del problema(será necesario
 configurar bien el Pandora FMS).

 El servidor Apache estaba detenido y en los logs del kernel aparecen
 estos mensajes:

 Sep 24 03:27:10 web kernel: [5160670.759468] INFO: task apache2:5429
 blocked for more than 120 seconds.

 Sep 24 03:27:10 web kernel: [5160670.761501] echo 0 
 /proc/sys/kernel/hung_task_timeout_secs disables this message.

 Sep 24 03:27:10 web kernel: [5160670.761796] apache2   D f6461e0c
0  5429   6529 0x

 Sep 24 03:27:10 web kernel: [5160670.761995]  f04ab740 00200082
 f6461ccc f6461e0c f6461e10 c1419100 c1419100 c14146ac

 Sep 24 03:27:10 web kernel: [5160670.762078]  f04ab8fc c2a08100
 0001 048a 0041 c13b13c0 c108af35 1d36

 Sep 24 03:27:10 web kernel: [5160670.762088]  c2a036ac f04ab8fc
 4cf68992  0d4bcc4a   

 Sep 24 03:27:10 web kernel: [5160670.762163] Call Trace:

 Sep 24 03:27:10 web kernel: [5160670.763072]  [c108af35] ?
 zone_watermark_ok+0x16/0x99

 Sep 24 03:27:10 web kernel: [5160670.763104]  [c126d54a] ?
 io_schedule+0x5f/0x98

 Sep 24 03:27:10 web kernel: [5160670.763700]  [f839b6ba] ?
 nfs_wait_bit_uninterruptible+0x5/0x8 [nfs]

 Sep 24 03:27:10 web kernel: [5160670.763710]  [c126d9d1] ?
 __wait_on_bit+0x33/0x58

 Sep 24 03:27:10 web kernel: [5160670.763731]  [f839b6b5] ?
 nfs_wait_bit_uninterruptible+0x0/0x8 [nfs]

 Sep 24 03:27:10 web kernel: [5160670.763738]  [c126daab] ?
 out_of_line_wait_on_bit+0xb5/0xbd

 Sep 24 03:27:10 web kernel: [5160670.763755]  [f839b6b5] ?
 nfs_wait_bit_uninterruptible+0x0/0x8 [nfs]

 Sep 24 03:27:10 web kernel: [5160670.763770]  [c1044067] ?
 wake_bit_function+0x0/0x3c

 Sep 24 03:27:10 web kernel: [5160670.763788]  [f839b6af] ?
 nfs_wait_on_request+0x19/0x1f [nfs]

 Sep 24 03:27:10 web kernel: [5160670.763805]  [f839f26f] ?
 nfs_updatepage+0x1a0/0x4b1 [nfs]

 Sep 24 03:27:10 web kernel: [5160670.763821]  [f839f5ae] ?
 nfs_flush_incompatible+0x2e/0x4a [nfs]

 Sep 24 03:27:10 web kernel: [5160670.763836]  [f83937c9] ?
 nfs_write_end+0x104/0x12d [nfs]

 Sep 24 03:27:10 web kernel: [5160670.763856]  [c108841e] ?
 generic_file_buffered_write+0x12f/0x21d

 Sep 24 03:27:10 web kernel: [5160670.763864]  [c1088909] ?
 __generic_file_aio_write+0x265/0x28d

 Sep 24 03:27:10 web kernel: [5160670.763875]  [c11ceb27] ?
 sock_common_recvmsg+0x2f/0x45

 Sep 24 03:27:10 web kernel: [5160670.763881]  [c11ccef0] ?
 __sock_recvmsg+0x50/0x58

 Sep 24 03:27:10 web kernel: [5160670.763945]  [c1088982] ?
 generic_file_aio_write+0x51/0x93

 Sep 24 03:27:10 web kernel: [5160670.763968]  [f83941f3] ?
 nfs_file_write+0xf5/0x159 [nfs]

 Sep 24 03:27:10 web kernel: [5160670.763984]  [c10b314e] ?
 do_sync_write+0xc0/0x107

 Sep 24 03:27:10 web kernel: [5160670.763997]  [c104403a] ?
 autoremove_wake_function+0x0/0x2d

 Sep 24 03:27:10 web kernel: [5160670.764014]  [c1033d67] ?
 do_setitimer+0x1be/0x1d0

 Sep 24 03:27:10 web kernel: [5160670.764030]  [c11027e0] ?
 security_file_permission+0xc/0xd

 Sep 24 03:27:10 web kernel: [5160670.764041]  [c10b308e] ?
 do_sync_write+0x0/0x107

 Sep 24 03:27:10 web kernel: [5160670.764051]  [c10b3a58] ? 
 vfs_write+0x7e/0xd6

 Sep 24 03:27:10 web kernel: [5160670.764061]  [c10b3b48] ? 
 sys_write+0x3c/0x63

 Sep 24 03:27:10 web kernel: [5160670.764073]  [c10030fb] ?
 sysenter_do_call+0x12/0x28

 Datos:

 Debian  6.0.2

 uname -a
 Linux web 2.6.32-5-686 #1 SMP Mon Jun 13 04:13:06 UTC 2011 i686 GNU/Linux

 Los logs de Apache son almacenado en un servidor NFS en nuestra red
 local, ¿estos mensajes están relacionado con eso?

 La configuración de Apache es la siguiente:

 Timeout 1800

 KeepAlive On

 MaxKeepAliveRequests 1000

 DumpIOInput On
 DumpIOLogLevel debug

 IfModule mpm_prefork_module
 StartServers 20
 MinSpareServers  10
 MaxSpareServers  10
 MaxClients  150
 MaxRequestsPerChild   1
 /IfModule

 IfModule mpm_event_module
 StartServers  2
 MaxClients  150
 MinSpareThreads  25
 MaxSpareThreads  75
 ThreadLimit  64
 ThreadsPerChild  25
 MaxRequestsPerChild   0
 /IfModule

 User ${APACHE_RUN_USER}
 Group ${APACHE_RUN_GROUP}

 ¿Alguien me puede dar alguna pista?

 Ahora mismo tengo el servicio funcionando porque he reiniciado el Apache.

 Gracias, un saludo.



Hola,

Pues tiene toda la pinta, parece que tienes un problema con NFS y el
hilo se bloquea al no poder escribir el archivo de log. Podrías escribir
los log a local y programar el volcado a NFS o bien usar rsync. De este
modo un problema con NFS no te fastidiaría apache.

Un saludo.


-- 
To UNSUBSCRIBE, email to debian-user-spanish-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive: http://lists.debian.org/4e8026cb.5030...@limbo.ari.es

Re: INFO: task apache2:5389 blocked for more than 120 seconds

2011-09-26 Por tema Camaleón
El Mon, 26 Sep 2011 09:08:40 +0200, Sergio Villalba escribió:

 Este fin de semana he tenido caídas en el servicio Web y la verdad que
 este mañana nos hemos dado cuenta del problema(será necesario
 configurar bien el Pandora FMS).
 
 El servidor Apache estaba detenido y en los logs del kernel aparecen
 estos mensajes:

(...)

 Sep 24 03:27:10 web kernel: [5160670.763700]  [f839b6ba] ?
 nfs_wait_bit_uninterruptible+0x5/0x8 [nfs]

(...)

La traza desde luego apunta a un problema en la escritura sobre el 
volumen NFS. Independientemente de que hagas tus pruebas y/o cambios para 
evitar ese problema, convendría informar de este fallo (si es que nadie 
lo ha hecho ya).

Google también tiene algo:

http://www.google.com/webhp?complete=0hl=en#sclient=psy-abhl=entbo=1complete=0tbs=qdr:ysource=hpq=nfs_wait_bit_uninterruptibletbo=1bav=on.2,or.r_gc.r_pw.fp=7b50c8ae48fc9f0abiw=1280bih=888

Saludos,

-- 
Camaleón


-- 
To UNSUBSCRIBE, email to debian-user-spanish-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive: http://lists.debian.org/pan.2011.09.26.10.35...@gmail.com