2010/8/21 Everton Pestana <evertonpest...@gmail.com>: > Prezados, > > > Trabalho numa empresa grande, e tenho um grande parque de servidores e > serviços a serem monitorados. > > Preciso de de uma ajuda pois o nagios esta tendo um comportamento > muito estranho. > > > Hoje estou rodando o nagios com um único no de processamento com 2GB de Ram. > > Com aproximadamente 3000 hosts e 6000 serviços. > > Estatisticas: > > > Services Actively Checked: > Time FrameServices Checked <= 1 minute:147 (2.6%)<= 5 minutes:5574 (99.5%) <= > 15 minutes:5574 (99.5%)<= 1 hour: 5574 (99.5%)Since program start: 5574 > (99.5%) MetricMin.Max.Average Check Execution Time: 0.00 sec23.26 sec0.402 > sec Check Latency:0.00 sec402.97 sec0.872 sec Percent State Change:0.00% > 6.12%0.01% > > > > > Check Statistics: > TypeLast 1 MinLast 5 MinLast 15 Min Active Scheduled Service Checks22526008 > 18041 > > > O que tem acontecido com o nagios, em determinados momento parece que > a maquina fica totalmente inativa, caem absurdamente os trafegos das > interfaces (quase zerando) e o load consequentemente cai tb. > > > Nesse momento observei que o nagios continua rodando, mas nenhum > processo filho é executado mais, a maquina parece morta. > Se eu der um reload no nagios tudo volta ao normal, mas depois de > algumas horas depois acontece novamente o mesmo problema.Normalmente > aconteceu as vezes que percebi as 4h da manha. > > > Olhei todos os logs do nagios e de sistema possíveis e imaginaveis, e > não ache nenhum erro nada que pudesse apontar tal comportamento. > > Desde já muito obrigado pela ajuda. > > Abs. > > Everton Pestana > ------------------------------------------------------------------------------ > Sell apps to millions through the Intel(R) Atom(Tm) Developer Program > Be part of this innovative community and reach millions of netbook users > worldwide. Take advantage of special opportunities to increase revenue and > speed time-to-market. Join now, and jumpstart your future. > http://p.sf.net/sfu/intel-atom-d2d > -- > Nagios-users-br@lists.sourceforge.net mailing list > https://lists.sourceforge.net/lists/listinfo/nagios-users-br > Wiki: http://nagios-br.sf.net/wiki >
Olá Everton, na lista internacional do Nagios existe uma discussão exatamente sobre um problema semelhante ao seu: problemas de estabilidade e escalabilidade em instâncias muito grandes do Nagios. Sugiro que vc dê uma olhada no histórico, pois o pessoal fez uma discussão bem longa com vááárias dicas de como resolver o problema. Pelo que eu lembro, não foi nenhuma ação isolada que corrigiu esse tipo de problema, mas várias ações que aumentaram a eficiencia do Nagios em processar os serviços e hosts. ------------------------------------------------------------------------------ Sell apps to millions through the Intel(R) Atom(Tm) Developer Program Be part of this innovative community and reach millions of netbook users worldwide. Take advantage of special opportunities to increase revenue and speed time-to-market. Join now, and jumpstart your future. http://p.sf.net/sfu/intel-atom-d2d -- Nagios-users-br@lists.sourceforge.net mailing list https://lists.sourceforge.net/lists/listinfo/nagios-users-br Wiki: http://nagios-br.sf.net/wiki