Ola lista,

De algum tempo para cá, provavelmente devido ao aumento no número de 
hosts e serviços a serem checados, notei que meu Nagios está começando a 
ter problemas de performance. Vários serviços estão ficando na fila  
(scheduling queue) durante muito tempo, ultrapassando o horário previsto 
da próxima checagem.

Li algumas informações sobre "performance tunning" na documentação 
oficial, porém ainda não encontrei valores de configurações que me 
atendam, por isso venho a vocês para quem saber resolver o meu problema.

Estou usando o  nagios-1.1   - eu sei, está bem desatualizado... mas vou 
providenciar atualização breve ;o)
A maquina que roda o nagios fica praticamente exclusiva para esse fim e 
não apresenta problema de sobrecarga de cpu , nem comprometimento de 
performance de disco e afins..

Seguem algumas informações sobre a  performance atual:

Program-Wide Performance Information
Active Checks:
   
Time Frame    Checks Completed
<= 1 minute:    12 (1.8%)
<= 5 minutes:    78 (11.9%)
<= 15 minutes:    258 (39.2%)
<= 1 hour:    281 (42.7%)
Since program start:      281 (42.7%)
   
Metric    Min.    Max.    Average
Check Execution Time:      < 1 sec    11 sec    0.198 sec
Check Latency:    < 1 sec    616 sec    138.872 sec
Percent State Change:    0.00%    0.00%    0.00%
Passive Checks:
   
Time Frame    Checks Completed
<= 1 minute:    0 (0.0%)
<= 5 minutes:    0 (0.0%)
<= 15 minutes:    0 (0.0%)
<= 1 hour:    0 (0.0%)
Since program start:      0 (0.0%)
   
Metric    Min.    Max.    Average
Percent State Change:  0.00%    0.00%    0.00%


O nagios -s /etc/nagios/nagios.cfg me retornou os seguintes valores:


        SERVICE SCHEDULING INFORMATION
        -------------------------------
        Total services:             793
        Total hosts:                68

        Command check interval:     -1 sec
        Check reaper interval:      5 sec

        Inter-check delay method:   SMART
        Average check interval:     715.309 sec
        Inter-check delay:          0.902 sec

        Interleave factor method:   SMART
        Average services per host:  11.662
        Service interleave factor:  12

        Initial service check scheduling info:
        --------------------------------------
        First scheduled check:      1186596717 -> Wed Aug  8 15:11:57 2007
        Last scheduled check:       1186597441 -> Wed Aug  8 15:24:01 2007

        Rough guidelines for max_concurrent_checks value:
        -------------------------------------------------
        Absolute minimum value:     6
        Recommend value:            18


Meu nagios.cfg atualmente tem os seguinte valores (estou enviado somente 
os valores relevantes) :

service_reaper_frequency=5
max_concurrent_checks=6
command_check_interval=-1

Ja tentei aumentar o  service_reaper_frequency para 10, 15 e 25.. Só 
piorou a situação..
Já tentei aumentar o max_concurrent_checks para 18 (como recomendado 
acima), mantendo service_reaper_frequency=5, mas tambem não surtiu 
efeito...

E de resto a maioria das opções é a default ..

Alguma dica??

-------------------------------------------------------------------------
This SF.net email is sponsored by: Splunk Inc.
Still grepping through log files to find problems?  Stop.
Now Search log events and configuration files using AJAX and a browser.
Download your FREE copy of Splunk now >>  http://get.splunk.com/
-- 
Nagios-users-br@lists.sourceforge.net mailing list
https://lists.sourceforge.net/lists/listinfo/nagios-users-br
Wiki: http://nagios-br.sf.net/wiki

Responder a