Oi Tiago,

Na verdade o q acontece eh q o Nagios 2.0 tem um esquema de persistencia de logs melhor estruturado. Na versao 1.2 qdo vc tem varias reinicializacoes o Nagios perde status de dispositivos, mesmo qdo vc configura para ter persistencia de logs. Por isso sempre q possivel eu acho melhor nao rotacionar os logs e manter em disco. O meu problema em particular eh q eu gerencio links de radio, e eh bem comum ter quedas no link. Assim os meus logs no Nagios sao monstruosos e eu preciso rotacionar eles ao menos semanalmente. Tanto na versao 1.2 como na 2.0, ao rotacionar os logs ou reinicializar o Nagios antes eh feito um registro de status para manter uma "foto" do estado dos dispositivos monitorados. No entanto, na versao 1.2 esses status nao sao registrados no novo nagios.log e muitas vezes vc perde o estado inicial. E se vc perder o arquivo q tem o estado entao eh uma lastima. Mesmo usando o backtracking maior vc continua tendo esses problemas. No caso da 2.0, qdo ele rotaciona os logs, ele grava novamente no inicio do log os estados dos dispositivos. Assim, se vc perde um arquivo de log vc perde apenas as informacoes referentes a aquele arquivo em particular.

Isso vc nao acha no manual. Mas vc pode ver nas demais documentacoes (changelog, whatsnew...). Ah sim, o 2.0 reconhece os logs do 1.2. Nao sei se ta documentado, mas isso eu verifiquei na pratica.

sd,
Edgar

Tiago Canoas A Silva escreveu:

Edgar,

Obrigado pela ajuda abaixo. So me explica uma coisa.

Você comenta abaixo que na versao 2.0 é possivel estrutura melhor os logs.

Como se pode estruturar melhor os logs no nagios? No manual eu encontro referencia sobre isso?

Atenciosamente,
Tiago Canoas A Silva



-----Mensagem original-----
De: [EMAIL PROTECTED] [mailto:[EMAIL PROTECTED] Em nome de Shine
Enviada em: quarta-feira, 31 de agosto de 2005 23:36
Para: nagios-users-br@lists.sourceforge.net
Assunto: Re: RES: [Nagios-users-br] duvida no relatorio de disponibilidade

Não sei se alguem respondeu sobre a parte do problema de relatório de 
disponibilidade.
Eu nao fui. Minha participacao na comunidade eh bem recente.

Mas la vai algumas coisas que notei por aqui, que gostaria de saber se alguem 
notou isso também.
Recentemente, fiz a atualização do nagios para a versão 2.0 (antes de atualizar 
não cheguei a verificar se isso acontecia tambem).
Acontece na 1.2 tbm...

Quando fui verificar o relatorio de disponibilidade, aparecia para mim que a 
maior parte do tempo estava indeterminado, o que achei estranho.
Na opções do relatório, tem duas opções, que são para informar qual era o 
estado original do host e do serviço, quando modifiquei para UP no caso de 
host, e para OK no caso de serviço, o relatorio saiu de forma mais coerente, 
onde o que antes estava como indeterminado, apareceu como UP.
Correto.

Isso aconteceu quando escolhi os ultimos 7 dias, mas quando escolhi para este 
ano, a maioria dos servidores que estava como indeterminado, ficaram como 100% 
como Time Down.
Cada caso um caso... vc monitora desde o comeco do ano? Tem todos os logs desde 
o comeco do ano no nagios.log?

Alguem tem ideia de como corrigir isso?
O q acontece eh q o estado inicial do host nao foi encontrado no log.
Qdo vc assume um estado inicial, ele assume a partir do inicio um estado. Mas 
se houveram reinicializacoes nesse meio e o estado tbm nao foi logado, entao 
esses pontos ficarao como indeterminado.
Infelizmente nao ha correcao nesses casos.

Para alguns servidores novos que coloquei, isso não acontence.
O q significa q neles os logs de inicializacao do nagios estao registrados.

Mais comentarios do outro email abaixo.

Aproveito a dúvida do Serial para ver se consigo também ajuda com esse "bendito" relatório de disponibilidade que tanta dor de cabeça me dá
:)
O trend reports eh realmente um ponto dificil do nagios...

Nos relatórios de disponibilidade, seja qual período for, está dando para a 
maioria dos hosts 100% do tempo, como indeterminado o estado.
Geralmente sao perdas de logs.

Para outros, estão saindo valores loucos... Eu pesquisei e encontrei algumas coisas dizendo para 
aumentar o campo "backtracked archive", pois o Nagios poderia estar atribuindo esses 
valores, por não ter conseguido encontrar os estados dos hosts no período especificado. Fiz isso, 
mas não funcionou :(( Uma outra dica que achei foi atribuir um estado inicial na geração do 
relatório, mas isso é uma ação "estranha", já que eu precisaria saber os estados iniciais 
de todos os hosts/serviços no início do período para gerar o relatório... Mas enfim, abstraindo 
isso, mesmo assim os resultados não sairam corretos.
Vc pode enganar o nagios atribuindo estados iniciais no nagios.log. O fato de 
vc aumentar o backtracked archive diz q vc ira consultar os logs do 
var/archives em maior numero.
A maioria nao rotaciona o naigos.log para nao ter q fazer isso. Embora nem 
sempre seja possivel.

Alguem já passou por uma situação semelhante?
Eu passei varias e varias vezes. E na maioria das vezes nao tive alternativa 
senao engolir q perdi o relatorio.
Um dos motivos q me levaram a ir para a versao 2.0 foi justamente o fato dessa 
vs estruturar melhor os logs.

sd,
Edgar




-------------------------------------------------------
SF.Net email is Sponsored by the Better Software Conference & EXPO
September 19-22, 2005 * San Francisco, CA * Development Lifecycle Practices
Agile & Plan-Driven Development * Managing Projects & Teams * Testing & QA
Security * Process Improvement & Measurement * http://www.sqe.com/bsce5sf
_______________________________________________
Nagios-users-br mailing list
Nagios-users-br@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/nagios-users-br
Archives: http://www.mail-archive.com/nagios-users-br@lists.sourceforge.net/
http://news.gmane.org/gmane.network.nagios.user.brazil

Responder a