Re: [Nagios-users-br] Problemas Nagios * Exibir Resposta*

2010-06-08 Por tôpico Leonardo Carneiro - Veltrac
e confirma as permissões tb.



Jose Oliveira wrote:
> Luis
>
> Na saída do seu script, quando está testando se o resultado obtido é OK,
> WARNING ou CRITICAL, o script deve terminar com exit 0, 1 ou 2 conforme a
> situação estiver OK, WARNING ou CRITICAL...
>
> Quanto ao null, veja se o script retorna somente uma linha. O Nágios só
> mostra na interface uma linha, mesmo que ela seja relativamente grande. Se
> for grande, o browser se encarrega de quebrá-la...
>
> []s
>
>
>
> 2010/6/8 Luis Henrique 
>
>   
>> Boa Tarde pessoal...
>> Estou tendo um problema com o Nagios, Fiz um script, que na linha de
>> comando ele funciona, Más quando coloco para o Nagios monitorar ele da
>> mensagem de Null e fica verde, Alguem pode me ajudar???
>> Segue o script, (Este script server para pegar a memoria total do PC /
>> free -mt, e transforma em porcentagem.
>> ###
>> # Script to check real memory usage
>> # L.Henrique 07/06/10 - V.2.0
>> # --
>> #   Script Modifications  ##
>> # --
>> #!/bin/bash
>> USAGE="`basename $0` [-w|--warning]
>> [-c|--critical]"
>> THRESHOLD_USAGE="WARNING threshold must be greater than CRITICAL:
>> `basename $0` $*"
>> calc=/tmp/totalcalc
>>
>> percent_free=/tmp/freepercent
>>
>> critical=""
>>
>> warning=""
>>
>> STATE_OK=0
>>
>> STATE_WARNING=1
>>
>> STATE_CRITICAL=2
>>
>> STATE_UNKNOWN=3
>>
>> # print
>> usage
>> if [[ $# -lt 4
>> ]]
>> then
>>
>>echo
>> ""
>>echo "Wrong Syntax: `basename $0`
>> $*"
>>echo
>> ""
>>echo "Usage:
>> $USAGE"
>>echo
>> ""
>>exit
>> 0
>> fi
>>
>> # read
>> input
>> while [[ $# -gt 0
>> ]]
>> do
>>
>> case "$1"
>> in
>> -w|--warning)
>>
>> shift
>>
>> warning=$1
>>
>> ;;
>>
>> -c|--critical)
>>
>> shift
>>
>> critical=$1
>>
>> ;;
>>
>> esac
>>
>> shift
>>
>>
>> done
>>
>> # verify
>> input
>> if [[ $warning -eq $critical || $warning -lt $critical
>> ]]
>> then
>>
>>  echo
>> ""
>>  echo
>> "$THRESHOLD_USAGE"
>>  echo
>> ""
>>  echo "Usage:
>> $USAGE"
>>  echo
>> ""
>> exit
>> 0
>>
>> fi
>>
>> # Total memory
>> available
>> total=`free -mt | grep 'Total:' | awk '{print
>> $3}'`
>> # Total memory
>> used
>> used=`free -mt | grep 'Total:' | awk '{print
>> $2}'`
>> # Calc total minus
>> used
>> free=`free -mt | grep 'Total:' | awk '{print
>> $2-$3}'`
>> # normal
>> values
>> #echo "$total"MB
>> total
>> #echo "$used"MB
>> used
>> #echo "$free"MB
>> free
>> # make it into % percent free = ((used  /  total) *
>> 100)
>>  echo "5" > $calc # decimal
>> accuracy
>>  echo "k" >> $calc # commit
>>  echo "100" >> $calc # multiply
>>  echo "$total" >> $calc # division integer
>>  echo "$used" >> $calc # division integer
>>  echo "/" >> $calc # division sign
>>  echo "*" >> $calc # multiplication sign
>>  echo "p" >> $calc # print
>> percent=`/usr/bin/dc $calc|/bin/sed 's/^\./0./'|/usr/bin/tr "." "
>> "|/usr/bin/gawk {'print $1'}`
>> #percent1=`/usr/bin/dc $calc`
>> #echo "$percent1"
>> if [[ "$percent" -le  $critical ]]
>>  then
>>  echo "CRITICAL-$free MB Free ($percent% Used Memory)"
>>  exit 0
>> fi
>> if [[ "$percent" -le  $warning ]]
>>  then
>>  echo "WARNING-$free MB Free ($percent% Used Memory)"
>>  exit 0
>> fi
>> if [[ "$percent" -gt  $warning ]]
>>  then
>>  echo "OK-$free MB Free ($percent% Used Memory)"
>>  exit 0
>> ###
>> Command.cfg
>>
>> #Teste ckeck_mem
>> define command{
>>command_namecheck_mem
>>command_line$USER1$/check_mem -w $ARG1$ -c $ARG2$
>> }
>>
>> ###
>> Erro Nagios:
>>
>> Memoria Real
>> <
>> http://bio00378/nagios/cgi-bin/extinfo.cgi?type=2&host=localhost&service=Memoria+Real
>> 
>>
>>
>>OK  06-08-2010 15:08:55 0d 0h 16m 52s   1/4 (null)
>>
>>
>>
>> --
>> - 
>> Luis Henrique
>> Tecnologia da Informação
>> Bionexo do Brasil
>> 55 11 3133-8110
>> lsi...@bionexo.com
>>
>> www.bionexo.com.br
>> Av.: Luiz Carlos Berrini, 936,
>> 12° andar Novo Brooklin - São Paulo - SP
>>
>>
>>
>> --
>> ThinkGeek and WIRED's GeekDad team up for the Ultimate
>> GeekDad Father's Day Giveaway. ONE MASSIVE PRIZE to the
>> lucky parental unit.  See the prize list and enter to win:
>> http://p.sf.net/sfu/thinkgeek-promo
>> --
>> Nagios-users-br@lists.sourceforge.net mailing list
>> https://lists.sourceforge.net/lists/listinfo/nagios-users-br
>> Wiki: http://nagios-br.sf.net/wiki
>>
>> 
>
>
>
>   

---

Re: [Nagios-users-br] Nagios de forma hierarquica

2010-05-25 Por tôpico Leonardo Carneiro - Veltrac
Oi Augusto. Sem o uso de NSCA eu desconheço, mas talvez administradores 
mais experientes no assunto possam conhecer alguma maneira.




augusto.jorge wrote:
> Oi,
>
> Eu gostaria de saber se é possível utilizar o Nagios da seguinte forma:
>
> "Há vários servidores Nagios instalados em algumas localidades distintas, e
> esses servidores espalhados estejam conectados a um servidor do Nagios
> principal, que agrega as informações. Neste caso haveria uma hierarquia de
> servidores de monitoramente, e não o uso de pluguins como NSCA e o NRPE."
>
> Se for possível, existe como indicar algum material.
>
>
> Grato
>
>
>   

--

-- 
Nagios-users-br@lists.sourceforge.net mailing list
https://lists.sourceforge.net/lists/listinfo/nagios-users-br
Wiki: http://nagios-br.sf.net/wiki


Re: [Nagios-users-br] RES: "Criar variavel" nos arquivos de configuração do nagios

2010-05-20 Por tôpico Leonardo Carneiro - Veltrac
benedito.ra...@caixa.gov.br wrote:
> Ígor,
>
> Complementando o Marcel, essa variável que você precisa, tem que ser incluída 
> no arquivo resource.cfg do Nagios.
>   
Não necessariamente, se eu entendi bem o que o Ígor precisa. Eu tenho um 
serviço (que na verdade é uma query em um banco banco), o qual eu passo 
como parâmetro para query um ID do banco, e esse ID é uma variável 
customizada definida na definição do host (pois é única para cada host).
>
> -Mensagem original-
> De: Marcel [mailto:mits...@gmail.com] 
> Enviada em: quarta-feira, 19 de maio de 2010 21:03
> Para: Unofficial Brazilian (Portuguese) Nagios Users List
> Assunto: Re: [Nagios-users-br]"Criar variavel" nos arquivos de configuração 
> do nagios
>
> sim, procure pro custom macro variables na documentação.
>
> 2010/5/19 Igor NM 
>
>   
>> Olá a todos!!
>>
>> Estou precisando de uma solução meio "estranha".
>> Estou monitorando vários servidores via internet e para cada um deles
>> utilizo uma senha diferente.
>>
>> Minha duvida é a seguinte... teria como criar uma variável com um nome
>> qualquer na seção "host" ou "service"?
>>
>> O objetivo seria informar a senha de cada servidor e recuperá-la no
>> comando,
>> igual a variável $HOSTADDRESS$
>>
>> Utilizo o comando check_nt para pegar as informações, bastaria apenas
>> colocar o parâmetro "-s" com o nome da variável. Bem mais simples do que
>> informar a senha a cada comando, e muito mais fácil para administrar e
>> trocar as senhas.
>>
>> Obrigado,
>> Ígor
>>
>>
>>
>> --
>>
>> --
>> Nagios-users-br@lists.sourceforge.net mailing list
>> https://lists.sourceforge.net/lists/listinfo/nagios-users-br
>> Wiki: http://nagios-br.sf.net/wiki
>>
>> 
> --
>
>   

--

-- 
Nagios-users-br@lists.sourceforge.net mailing list
https://lists.sourceforge.net/lists/listinfo/nagios-users-br
Wiki: http://nagios-br.sf.net/wiki


Re: [Nagios-users-br] RES: Nagios em rede GRANDE, BEM GRANDE.

2010-05-18 Por tôpico Leonardo Carneiro - Veltrac
Oi Benedito. Você cogitou usar monitoramento distribuído para evitar 
problemas de sobrecarga no Nagios?



benedito.ra...@caixa.gov.br wrote:
> Grande Jotagera,
>
> Não uso o ndobd.
> Apenas o NagiosQL prá administração do Nagios.
> Meu parâmetro max_concurrent_checks=0
>
> Pauleira. 6000 serviços.
> Tô achando que o Nagios arriou.
>
> Diramos
>
>
> -Mensagem original-
> De: Jose Oliveira [mailto:jotag...@gmail.com] 
> Enviada em: segunda-feira, 17 de maio de 2010 21:31
> Para: Unofficial Brazilian (Portuguese) Nagios Users List
> Assunto: Re: [Nagios-users-br] Nagios em rede GRANDE, BEM GRANDE.
>
> Olá amigo
>
> Tem um parametro no qual voce especifica quantas checagens o Nagios deve
> disparar em paralelo. Assim, esta quantidade limita a capacidade do Nagios e
> ele enfileira as checages. Eu, que tenho somente 1000 serviços, deixo este
> careta com zero ou seja, sem limite de paralelismo...
>
> Deve ser este seu problema...
>
> Voce está salvando dados no Mysql com ndodb ou não?
>
>
>
> Em 17 de maio de 2010 18:09,  escreveu:
>
>   
>> Bem, pessoal.
>>
>> Seguindo as diversas dicas do pessoal daqui, tenho obtido avanços
>> significativos na empreita de instalar o Nagios em larga escala.
>> Mudei diversos parâmetros dos arquivos de configuração, inclusive de
>> compilação. Passei a usar Perl embdded, etc.
>> Estou só terminando os ajustes finos, prá depois fazer um resumo e postar
>> aqui, para uso de outros futuros "sortudos" que enfrentem o mesmo problema
>> que eu.
>> Por ora, é o seguinte:
>>
>> Estou com problema de atraso nas checagens de serviços.
>> Configurei o service template para fazer a checagem de 5 em 5 minutos.
>> Mas, na prática, quando eu listo os serviços na página do Nagios, e mando
>> ordenar por ordem de last time check, tem serviço cuja última checagem foi
>> de 1 hora atrás (coluna Last check).
>> Por outro lado, em Performance Info, obtenho o seguinte quadro sobre
>> services:
>>
>> Time Frame Services Checked
>> <= 1 minute: 27 (0.4%)
>> <= 5 minutes: 1598 (25.3%)
>> <= 15 minutes: 5169 (81.7%)
>> <= 1 hour: 6296 (99.5%)
>> Since program start:   6296 (99.5%
>>
>> A meu ver, o quadro acima indica que todos os serviços foram checados em
>> aproximadamente 20 minutos.
>>
>> Então eu questiono:
>>
>> 1 - Porque essa demora de 1 hora entre uma checagem e outra de serviço?
>> Aqueles horários que aparecem na coluna "Last check" realmente indicam o
>> horário da última checagem?
>> 2 - Existe algum parâmetro a ser configurado no Nagios.cfg que melhore essa
>> performance, diminuindo o tempo entre checagens?
>> 3 - Porque a checagem não é feita a cada 5 minutos, como configurado no
>> template de serviço?
>> 4 - Li algo sobre paralelização de checagem de serviço. Seria o caso? Como
>> usar isso?
>>
>> Lembro, mais uma vez, que o quesito hardware está tranqüilo, com picos de
>> utilização de CPU e memória de no máximo 25%.
>>
>> Aguardo,
>>
>> Grato desde já.
>>
>> Diramos
>>
>>
>> -Mensagem original-
>> De: Shine [mailto:esh...@gmail.com]
>> Enviada em: quarta-feira, 5 de maio de 2010 20:56
>> Para: Unofficial Brazilian (Portuguese) Nagios Users List
>> Assunto: Re: [Nagios-users-br] RES: Nagios em rede GRANDE, BEM GRANDE.
>>
>> O uso do protocolo TCP é mais confiável que UDP simplesmente porque o
>> protocolo é orientado a conexão. Em palavras mais simples, ele faz a
>> recuperação de pacotes de rede perdido no próprio protocolo, enquanto
>> que o UDP depende da aplicação conferir e fazer a recuperação da
>> informação.
>> Mas as perdas existem tanto com o uso de um ou outro protocolo. E
>> dependendo da escala de monitoração, usar TCP para contornar uma
>> deficiência da rede pode trazer outros problemas.
>>
>> O SNMP pode oscilar não apenas por causa da rede, mas tbm pode falhar
>> se o agent estiver com problemas. Existem técnicas adequadas para cada
>> caso, mas se vc não tem uma conexão confiável por rede remota, melhor
>> fazer a monitoração por um agent na rede local e fazer o relay dos
>> resultados. Claro que estamos falando aqui de um evento de monitoração
>> e não um alarme (notification, trap) no SNMP.
>>
>> Então para uma monitoração adequada, precisamos primeiro ver se a
>> condição que gera os resultados indesejados é a rede e aplicar
>> correções na rede ou mudar a topologia do agente Nagios para contornar
>> a situação, por exemplo usando NSCA. Se a situação é mais devido à
>> demora da aplicação SNMP do host monitorado, ajustar parâmetros de
>> timeout pode ajudar.
>>
>> Um outro ponto a ser considerado é quantos threads podem ser rodados
>> simultaneamente. Em se usando uma aplicação com uma resposta não muito
>> imediata como o SNMP, faz sentido ter a máxima quantidade de threads
>> simultâneos, uma vez que a interação com o host monitorado demora bem
>> mais que uma interação com ping (por exemplo). Como vc usa o valor
>> default, então não há limitações... mas vale a pena checar. Tem q ser
>> zero. ;)
>>
>> sd,
>> Edgar
>>
>> Em 5 de maio de 2010 

Re: [Nagios-users-br] Monitorar Servidores Linux - Swap+Memoria Fisica

2010-05-18 Por tôpico Leonardo Carneiro - Veltrac
Olá José, Luis e toda a lista. Eu até fiz algo parecido, mas acabei não 
utilizando e apaguei. Eu fiz um script que chama os scripts check_mem e 
check_swap com parametros para ignorar o que estivesse em cache, 
filtrando exclusivamente o que estiver em uso na memória. Se você tiver 
alguma habilidade de scripting em bash é bem fácil escrever algo assim. 
O padrão de saída que o nagios espera de um script é simples.



Jose Oliveira wrote:
> Luis
>
> Onde trabalho, temos um plugin que monitora memória fisica e swap. Posso te
> mandar o fonte amanhã. ão tem um ./configure para geralmente funcina os
> servidores Intel com Linux Red Hat e Sparc com Solaris que temos.
>
> Mas gostaria de argumentar com voce quanto ao comportamento do servidor...
>
> A memória tende a 100% porque o Linux (e a maioria dos sistemas atuais,
> incluindo Windows) faz cache de arquivos na memória.
>
> Temos um servidor com 32Gb de RAM rodando Oracle, sendo que o Oracle pega
> 4Gb para si (configuração estática). O Banco tem aproximadamente 800Gb e
> depois de umas 4 horas de produção a memória bate em 97%... Normal.
>
> Quanto ao swap, o desejável é que não aconteça sua utilização, porque disco
> é muito lento e memória muito barata hoje em dia. Se o Linux manda para swap
> o gnome, por exemplo, porque ninguem usa a interface gráfica, tá
> maravilhoso... De resto, tente administrar para que o swap nunca seja
> utilizado.
>
>
> []s
>
>
> Em 17 de maio de 2010 14:11, Luis Henrique  escreveu:
>
>   
>> Amigos,
>> alguém sabe me dizer como monitorar Swap+Memoria física de Servidores
>> linux pelo nagios.
>> Preciso monitorar os 2 juntos...pq? Nem sempre o Swap a 98% e problema,
>> o problema e quando esta memoria física e Swap a 98%, ai é B.O para de
>> Server mesmo.
>>
>> Como dito, preciso de um plugin que pegue o valor real da memoria fisica
>> e Swap como um todo.
>>
>> Desde Já agradeço a ajuda.
>> --
>> - 
>> Luis Henrique
>> Tecnologia da Informação
>> Bionexo do Brasil
>> 55 11 3133-8110
>> lsi...@bionexo.com
>>
>> www.bionexo.com.br
>> Av.: Luiz Carlos Berrini, 936,
>> 12° andar Novo Brooklin - São Paulo - SP
>>
>>
>> --
>>
>> --
>> Nagios-users-br@lists.sourceforge.net mailing list
>> https://lists.sourceforge.net/lists/listinfo/nagios-users-br
>> Wiki: http://nagios-br.sf.net/wiki
>>
>> 
>
>
>
>   

--

-- 
Nagios-users-br@lists.sourceforge.net mailing list
https://lists.sourceforge.net/lists/listinfo/nagios-users-br
Wiki: http://nagios-br.sf.net/wiki