2011/9/22 Alberto Bertogli <[email protected]>:
> On Thu, Sep 22, 2011 at 11:33:12AM +0200, Damian Montaldo wrote:
>> Esta mañana me encontré con procesos en estado "D" o uninterruptible
>> sleep que sí son molestos porque entiendo que pueden retener recursos
>> y en especial me interesa que no puedan hacer I/O. Ah y encima están
>> colgados del init, malditos!
>
> Nomas para agregar a lo que dijo Rodrigo, el hecho que esten colgados
> del init es pura casualidad y no tiene nada que ver.
Ok ese es un dato interesante.

> Es muy comun que los procesos que hagan I/O esten en D, solo que lo
> normal es que lo esten por periodos cortos, por eso no suele ser un
> problema.

Están así hace más de un mes :P

> Si tenes un proceso en D por mucho tiempo es o un bug del kernel, o que
> tenes algun problema de I/O tipo un disco muy lento o roto que tarda
> mucho tiempo en responder, o algun pedo de NFS como dijo Rodrigo.

Más que NFS es un file system distribuido en muchos discos (más de
600) y el IO en estas cosas distribuidas es todo un tema.
La teoría es una cosa pero la práctica es otra y es la primera vez que
le meto mano a algo de este tamaño.

> En el caso normal, solo hay que esperar un poquito que termine la
> operacion de I/O que los tiene bloqueados y ya, no es que una vez que
> entran en D ya no salen mas, eso es anormal.

Ahora desde afuera no puedo entrar para ver la fecha pero era más de
un mes seguro :P
Esto me llevó a armar un script que se fija en todos los nodos de
cómputo a ver si tienen procesos "D" haciendo IO y se fija la fecha
para ver si colgaron porque suele pasar que el sistema de colas no los
puede desalojar y hay veces que hasta se quedan morfando ram o swap.
Igual los nodos los reiniciaba por estas cosas cada tanto, pero este
guacho me ganó la lucha...

> Gracias,
>                Alberto
Gracias a vos.
_______________________________________________
Glug mailing list
[email protected]
http://glugcen.dc.uba.ar/cgi-bin/mailman/listinfo/glug

Responder a