[error] child process 32242 still did not exit, sending a SIGKILL

2007-03-09 Por tema N0K
:8100116ce240 80213f8e
Feb 25 06:45:54 Boix kernel: Call Trace: 8023a246{mmput+40}
80213f8e{do_exit+541}
Feb 25 06:45:54 Boix kernel:80246c38{cpuset_exit+0}
80229962{get_signal_to_deliver+1134}
Feb 25 06:45:54 Boix kernel:802283d2{do_signal+85}
80288c7c{specific_send_sig_info+161}
Feb 25 06:45:54 Boix kernel:
80288eec{force_sig_info+158}
8020a9d0{do_page_fault+1974}
Feb 25 06:45:54 Boix kernel:80210b3c{unmap_region+235}
80219531{remove_vma+85}
Feb 25 06:45:54 Boix kernel:8025a0d0{retint_signal+61}
Feb 25 06:45:54 Boix kernel:
Feb 25 06:45:54 Boix kernel: Code: 0f 0b 68 91 75 3f 80 c2 b3 07 59 5e
5b 5d 41 5c c3 53 48 89
Feb 25 06:45:54 Boix kernel:  1Fixing recursive fault but reboot is
needed!
Feb 25 06:46:40 Boix kernel: mm/memory.c:103: bad pgd
81000fef7000(300032797067).
Feb 25 06:46:40 Boix kernel: apache2[10546]: segfault at
 rip  rsp 7fff21371828 error 4
Feb 25 06:46:40 Boix kernel: --- [cut here ] - [please
bite here ] -
Feb 25 06:46:40 Boix kernel: CPU 0
Feb 25 06:46:40 Boix kernel: Modules linked in: xt_tcpudp xt_limit
xt_state iptable_nat ip_nat ip_conntrack_ftp ip_conntrack nfnetlink
iptable_filter ip_tables x_tables ipv6 button ac battery dm_snapshot
dm_mirror dm_mod loop snd_intel8x0 snd_ac97_codec snd_ac97_bus snd_pcm
snd_timer snd snd_page_alloc evdev irtty_sir serio_raw shpchp
pci_hotplug parport_pc parport sir_dev i810_audio ac97_codec intel_agp
i2c_i801 pcspkr psmouse irda i2c_core soundcore floppy crc_ccitt ext3
jbd mbcache sd_mod piix ata_piix generic ide_core uhci_hcd ehci_hcd
libata scsi_mod 8139too 8139cp mii thermal processor fan
Feb 25 06:46:40 Boix kernel: Pid: 10546, comm: apache2 Not tainted
2.6.17-2-amd64 #1
Feb 25 06:46:40 Boix kernel: RIP: 0010:[8023814d]
8023814d{exit_mmap+226}
Feb 25 06:46:40 Boix kernel: RSP: :81002450fd08  EFLAGS: 00010206
Feb 25 06:46:40 Boix kernel: RAX:  RBX: 81000100a2a0
RCX: 0070
Feb 25 06:46:40 Boix kernel: RDX: 0001 RSI: 8100295c34d8
RDI: 000295c3
Feb 25 06:46:40 Boix kernel: RBP:  R08: 8100011bc018
R09: 
Feb 25 06:46:40 Boix kernel: R10: 000b R11: 81002450fd10
R12: 810020a4f140
Feb 25 06:46:40 Boix kernel: R13: 0001 R14: 81002450fef8
R15: 81003d499698
Feb 25 06:46:40 Boix kernel: FS:  ()
GS:80509000() knlGS:
Feb 25 06:46:40 Boix kernel: CS:  0010 DS:  ES:  CR0:
8005003b
Feb 25 06:46:40 Boix kernel: CR2:  CR3: 00201000
CR4: 06e0
Feb 25 06:46:40 Boix kernel: Process apache2 (pid: 10546, threadinfo
81002450e000, task 81003d499100)
Feb 25 06:46:40 Boix kernel: Stack: 06ce 81000100a2a0
810020a4f140 810020a4f1c0
Feb 25 06:46:40 Boix kernel:000b 8023a246
000b 000b
Feb 25 06:46:40 Boix kernel:81003d499100 80213f8e
Feb 25 06:46:40 Boix kernel: Call Trace: 8023a246{mmput+40}
80213f8e{do_exit+541}
Feb 25 06:46:40 Boix kernel:80246c38{cpuset_exit+0}
80229962{get_signal_to_deliver+1134}
Feb 25 06:46:40 Boix kernel:802283d2{do_signal+85}
80288c7c{specific_send_sig_info+161}
Feb 25 06:46:40 Boix kernel:
80288eec{force_sig_info+158}
8020a9d0{do_page_fault+1974}
Feb 25 06:46:40 Boix kernel:8025e442{thread_return+0}
8025a0d0{retint_signal+61}
Feb 25 06:46:40 Boix kernel:
Feb 25 06:46:40 Boix kernel: Code: 0f 0b 68 91 75 3f 80 c2 b3 07 59 5e
5b 5d 41 5c c3 53 48 89
Feb 25 06:46:40 Boix kernel:  1Fixing recursive fault but reboot is
needed!

Cuando esto pasa, el sistema funciona bien, pero no hay forma de matar
el proceso que se queda pillado de apache. La única solución es
reiniciar el server.
Recuerdo que ademas de esto, en los logs de apache veía un segmentation
fault (11) y leí por ahí que esto podría ser debido a la memoria. La
cambie y efectivamente, desde entonces no he vuelto a ver sos errores
del kernel.
No se si ese antiguo error puede estar relacionado con este, pero ahora
todos los dias cuando rotan los logs y hace le apache restart, obtengo
estos mensajes en el error.log de apache:

[Fri Mar 09 09:01:08 2007] [warn] child process 32242 still did not
exit, sending a SIGTERM
[Fri Mar 09 09:01:10 2007] [warn] child process 32242 still did not
exit, sending a SIGTERM
[Fri Mar 09 09:01:12 2007] [warn] child process 32242 still did not
exit, sending a SIGTERM
[Fri Mar 09 09:01:14 2007] [error] child process 32242 still did not
exit, sending a SIGKILL
[Fri Mar 09 09:01:15 2007] [notice] caught SIGTERM, shutting down

Apache muere tras esto, todos los procesos quedan parados, pero se puede
arrancar apache

[error] child process 32242 still did not exit, sending a SIGKILL

2007-03-09 Por tema N0K
 kernel:8100116ce240 80213f8e
Feb 25 06:45:54 Boix kernel: Call Trace: 8023a246{mmput+40}
80213f8e{do_exit+541}
Feb 25 06:45:54 Boix kernel:80246c38{cpuset_exit+0}
80229962{get_signal_to_deliver+1134}
Feb 25 06:45:54 Boix kernel:802283d2{do_signal+85}
80288c7c{specific_send_sig_info+161}
Feb 25 06:45:54 Boix kernel:
80288eec{force_sig_info+158}
8020a9d0{do_page_fault+1974}
Feb 25 06:45:54 Boix kernel:80210b3c{unmap_region+235}
80219531{remove_vma+85}
Feb 25 06:45:54 Boix kernel:8025a0d0{retint_signal+61}
Feb 25 06:45:54 Boix kernel:
Feb 25 06:45:54 Boix kernel: Code: 0f 0b 68 91 75 3f 80 c2 b3 07 59 5e
5b 5d 41 5c c3 53 48 89
Feb 25 06:45:54 Boix kernel:  1Fixing recursive fault but reboot is
needed!
Feb 25 06:46:40 Boix kernel: mm/memory.c:103: bad pgd
81000fef7000(300032797067).
Feb 25 06:46:40 Boix kernel: apache2[10546]: segfault at
 rip  rsp 7fff21371828 error 4
Feb 25 06:46:40 Boix kernel: --- [cut here ] - [please
bite here ] -
Feb 25 06:46:40 Boix kernel: CPU 0
Feb 25 06:46:40 Boix kernel: Modules linked in: xt_tcpudp xt_limit
xt_state iptable_nat ip_nat ip_conntrack_ftp ip_conntrack nfnetlink
iptable_filter ip_tables x_tables ipv6 button ac battery dm_snapshot
dm_mirror dm_mod loop snd_intel8x0 snd_ac97_codec snd_ac97_bus snd_pcm
snd_timer snd snd_page_alloc evdev irtty_sir serio_raw shpchp
pci_hotplug parport_pc parport sir_dev i810_audio ac97_codec intel_agp
i2c_i801 pcspkr psmouse irda i2c_core soundcore floppy crc_ccitt ext3
jbd mbcache sd_mod piix ata_piix generic ide_core uhci_hcd ehci_hcd
libata scsi_mod 8139too 8139cp mii thermal processor fan
Feb 25 06:46:40 Boix kernel: Pid: 10546, comm: apache2 Not tainted
2.6.17-2-amd64 #1
Feb 25 06:46:40 Boix kernel: RIP: 0010:[8023814d]
8023814d{exit_mmap+226}
Feb 25 06:46:40 Boix kernel: RSP: :81002450fd08  EFLAGS: 00010206
Feb 25 06:46:40 Boix kernel: RAX:  RBX: 81000100a2a0
RCX: 0070
Feb 25 06:46:40 Boix kernel: RDX: 0001 RSI: 8100295c34d8
RDI: 000295c3
Feb 25 06:46:40 Boix kernel: RBP:  R08: 8100011bc018
R09: 
Feb 25 06:46:40 Boix kernel: R10: 000b R11: 81002450fd10
R12: 810020a4f140
Feb 25 06:46:40 Boix kernel: R13: 0001 R14: 81002450fef8
R15: 81003d499698
Feb 25 06:46:40 Boix kernel: FS:  ()
GS:80509000() knlGS:
Feb 25 06:46:40 Boix kernel: CS:  0010 DS:  ES:  CR0:
8005003b
Feb 25 06:46:40 Boix kernel: CR2:  CR3: 00201000
CR4: 06e0
Feb 25 06:46:40 Boix kernel: Process apache2 (pid: 10546, threadinfo
81002450e000, task 81003d499100)
Feb 25 06:46:40 Boix kernel: Stack: 06ce 81000100a2a0
810020a4f140 810020a4f1c0
Feb 25 06:46:40 Boix kernel:000b 8023a246
000b 000b
Feb 25 06:46:40 Boix kernel:81003d499100 80213f8e
Feb 25 06:46:40 Boix kernel: Call Trace: 8023a246{mmput+40}
80213f8e{do_exit+541}
Feb 25 06:46:40 Boix kernel:80246c38{cpuset_exit+0}
80229962{get_signal_to_deliver+1134}
Feb 25 06:46:40 Boix kernel:802283d2{do_signal+85}
80288c7c{specific_send_sig_info+161}
Feb 25 06:46:40 Boix kernel:
80288eec{force_sig_info+158}
8020a9d0{do_page_fault+1974}
Feb 25 06:46:40 Boix kernel:8025e442{thread_return+0}
8025a0d0{retint_signal+61}
Feb 25 06:46:40 Boix kernel:
Feb 25 06:46:40 Boix kernel: Code: 0f 0b 68 91 75 3f 80 c2 b3 07 59 5e
5b 5d 41 5c c3 53 48 89
Feb 25 06:46:40 Boix kernel:  1Fixing recursive fault but reboot is
needed!

Cuando esto pasa, el sistema funciona bien, pero no hay forma de matar 
el proceso que se queda pillado de apache. La única solución es 
reiniciar el server.
Recuerdo que ademas de esto, en los logs de apache veía un segmentation 
fault (11) y leí por ahí que esto podría ser debido a la memoria. La 
cambie y efectivamente, desde entonces no he vuelto a ver sos errores 
del kernel.
No se si ese antiguo error puede estar relacionado con este, pero ahora 
todos los dias cuando rotan los logs y hace le apache restart, obtengo 
estos mensajes en el error.log de apache:


[Fri Mar 09 09:01:08 2007] [warn] child process 32242 still did not
exit, sending a SIGTERM
[Fri Mar 09 09:01:10 2007] [warn] child process 32242 still did not
exit, sending a SIGTERM
[Fri Mar 09 09:01:12 2007] [warn] child process 32242 still did not
exit, sending a SIGTERM
[Fri Mar 09 09:01:14 2007] [error] child process 32242 still did not
exit, sending a SIGKILL
[Fri Mar 09 09:01:15 2007] [notice] caught SIGTERM, shutting down

Apache muere tras esto, todos los procesos quedan parados, pero se puede