2010/8/21 Everton Pestana <evertonpest...@gmail.com>:
> Prezados,
>
>
> Trabalho numa empresa grande, e tenho um grande parque de servidores e
> serviços a serem monitorados.
>
> Preciso de de uma ajuda pois o nagios esta tendo um comportamento
> muito estranho.
>
>
> Hoje estou rodando o nagios  com um único no de processamento com 2GB de Ram.
>
> Com aproximadamente 3000 hosts e 6000 serviços.
>
> Estatisticas:
>
>
> Services Actively Checked:
>  Time FrameServices Checked <= 1 minute:147 (2.6%)<= 5 minutes:5574 (99.5%) <=
> 15 minutes:5574 (99.5%)<= 1 hour: 5574 (99.5%)Since program start:  5574
> (99.5%)    MetricMin.Max.Average Check Execution Time:  0.00 sec23.26 sec0.402
> sec Check Latency:0.00 sec402.97 sec0.872 sec Percent State Change:0.00%
> 6.12%0.01%
>
>
>
>
> Check Statistics:
> TypeLast 1 MinLast 5 MinLast 15 Min Active Scheduled Service Checks22526008
> 18041
>
>
> O que tem acontecido com o nagios, em determinados momento parece que
> a maquina fica totalmente inativa, caem absurdamente os trafegos das
> interfaces (quase zerando) e o load consequentemente cai tb.
>
>
> Nesse momento observei que o nagios continua rodando, mas nenhum
> processo filho é executado mais, a maquina parece morta.
> Se eu der um reload no nagios tudo volta ao normal, mas depois de
> algumas horas depois acontece novamente o mesmo problema.Normalmente
> aconteceu as vezes que percebi as 4h da manha.
>
>
> Olhei todos os logs do nagios e de sistema possíveis e imaginaveis, e
> não ache nenhum erro nada que pudesse apontar tal comportamento.
>
> Desde já muito obrigado pela ajuda.
>
> Abs.
>
> Everton Pestana
> ------------------------------------------------------------------------------
> Sell apps to millions through the Intel(R) Atom(Tm) Developer Program
> Be part of this innovative community and reach millions of netbook users
> worldwide. Take advantage of special opportunities to increase revenue and
> speed time-to-market. Join now, and jumpstart your future.
> http://p.sf.net/sfu/intel-atom-d2d
> --
> Nagios-users-br@lists.sourceforge.net mailing list
> https://lists.sourceforge.net/lists/listinfo/nagios-users-br
> Wiki: http://nagios-br.sf.net/wiki
>

Olá Everton, na lista internacional do Nagios existe uma discussão
exatamente sobre um problema semelhante ao seu: problemas de
estabilidade e escalabilidade em instâncias muito grandes do Nagios.

Sugiro que vc dê uma olhada no histórico, pois o pessoal fez uma
discussão bem longa com vááárias dicas de como resolver o problema.

Pelo que eu lembro, não foi nenhuma ação isolada que corrigiu esse
tipo de problema, mas várias ações que aumentaram a eficiencia do
Nagios em processar os serviços e hosts.

------------------------------------------------------------------------------
Sell apps to millions through the Intel(R) Atom(Tm) Developer Program
Be part of this innovative community and reach millions of netbook users 
worldwide. Take advantage of special opportunities to increase revenue and 
speed time-to-market. Join now, and jumpstart your future.
http://p.sf.net/sfu/intel-atom-d2d
-- 
Nagios-users-br@lists.sourceforge.net mailing list
https://lists.sourceforge.net/lists/listinfo/nagios-users-br
Wiki: http://nagios-br.sf.net/wiki

Responder a