Hm.. eu não disse que monitoro 1k. Disse que a partir desse número em um
único server, haverão problemas.

No ambiente que administro, são 15 nagios distribuidos enviando resultados
via ndomod para um MySQL que é o back-end do WEB-UI. Utilizamos todos os
recursos possíveis de monitoração: NRPE para sites externos, SNMP para
infra-estrutura de redes, NSCA/Syslog-ng para monitoração passiva
distribuída, e assim vai.

Ao todo são ~4,5k hosts, ~18k serviços. No ambiente cacti, os resultados de
performance gerados pelos nagios-plugins são enviados via syslog-ng para o
pool de servidores cacti, que utilizam estes dados para geração de gráficos
de performance, o syslog-ng envia estes dados para o memcached, e o poller
do cacti foi patcheado para realizar o polling de ~25k data sources,
atualizando ~25k gráficos rrd assincronamente.

Tenho uma ferramenta para administrar as configurações de monitoração,
criada in-house e adaptada para uso próprio. Esta solução foi necessária
para geração sistemática dos arquivos de configuração.

Acho que essas soluções completas são suficientes para o seu ambiente. Mas a
medida que o volume aumentar, a necessidade de hardware aumentará
linearmente. A divisão das tarefas de monitoração/notificação, gráficos de
performance/tendência e WEB-UI foi necessária para aproveitar melhor o
hardware disponível.

A solução com memcached aumentou a vida útil do hardware em uma escala de
mais de 300%. Sem ele o pool de servidores cacti seria 3x maior.

2008/2/21 Vinícius de Figueiredo Silva <[EMAIL PROTECTED]>:

> Como trabalhar com o Nagios em ambientes grandes sem ficar maluco?
> Você disse que monitora 1K, usa somente o Nagios mesmo ou alguma
> ferramenta pra facilitar a configuração e deploy disso? Usa NRPE,
> SNMP, NSCA ou o que? Faz monitoração distribuída ou tem apenas um
> servidor?
>
> Se puder passar qualquer informação a respeito eu agradeço. Eu tenho
> por volta de 200 servidores e 1500+ serviços em redes diferentes,
> portanto mais do que um servidor de Nagios, e estou procurando uma
> maneira prática de manter o serviço monitorando e gerando gráficos de
> performance. Estou quase desistindo do Nagios e passando para algo
> mais 'completo' como o Zabbix ou Zenoss. As vezes acho que o Nagios
> precisa de um acabamento mais profissional pra ficar perfeito.
>
> Obrigado,
>
> Vinícius.
>
> 2008/2/20 Marcel <[EMAIL PROTECTED]>:
> > Posso dizer com conhecimento de causa: Se a quantidade de servidores
> >  monitorados chegar perto de 1k, com um servidor dual-core, 4G e discos
> SCSI,
> >  a solução de gráficos de performance (via Nagios) não escala. O ideal
> para
> >  garantir escalabilidade é separar as funções. Monitoração/Notificação =
> >  Nagios, Gráficos de tendência => cacti/torrus/whatever (com IO
> assíncrono),
> >  e o Nagios linka o gráfico correspondente via extended-info.
> >
>
> -------------------------------------------------------------------------
> This SF.net email is sponsored by: Microsoft
> Defy all challenges. Microsoft(R) Visual Studio 2008.
> http://clk.atdmt.com/MRT/go/vse0120000070mrt/direct/01/
> --
> [email protected] mailing list
> https://lists.sourceforge.net/lists/listinfo/nagios-users-br
> Wiki: http://nagios-br.sf.net/wiki
>
-------------------------------------------------------------------------
This SF.net email is sponsored by: Microsoft
Defy all challenges. Microsoft(R) Visual Studio 2008.
http://clk.atdmt.com/MRT/go/vse0120000070mrt/direct/01/
-- 
[email protected] mailing list
https://lists.sourceforge.net/lists/listinfo/nagios-users-br
Wiki: http://nagios-br.sf.net/wiki

Responder a