Hm.. eu não disse que monitoro 1k. Disse que a partir desse número em um único server, haverão problemas.
No ambiente que administro, são 15 nagios distribuidos enviando resultados via ndomod para um MySQL que é o back-end do WEB-UI. Utilizamos todos os recursos possíveis de monitoração: NRPE para sites externos, SNMP para infra-estrutura de redes, NSCA/Syslog-ng para monitoração passiva distribuída, e assim vai. Ao todo são ~4,5k hosts, ~18k serviços. No ambiente cacti, os resultados de performance gerados pelos nagios-plugins são enviados via syslog-ng para o pool de servidores cacti, que utilizam estes dados para geração de gráficos de performance, o syslog-ng envia estes dados para o memcached, e o poller do cacti foi patcheado para realizar o polling de ~25k data sources, atualizando ~25k gráficos rrd assincronamente. Tenho uma ferramenta para administrar as configurações de monitoração, criada in-house e adaptada para uso próprio. Esta solução foi necessária para geração sistemática dos arquivos de configuração. Acho que essas soluções completas são suficientes para o seu ambiente. Mas a medida que o volume aumentar, a necessidade de hardware aumentará linearmente. A divisão das tarefas de monitoração/notificação, gráficos de performance/tendência e WEB-UI foi necessária para aproveitar melhor o hardware disponível. A solução com memcached aumentou a vida útil do hardware em uma escala de mais de 300%. Sem ele o pool de servidores cacti seria 3x maior. 2008/2/21 Vinícius de Figueiredo Silva <[EMAIL PROTECTED]>: > Como trabalhar com o Nagios em ambientes grandes sem ficar maluco? > Você disse que monitora 1K, usa somente o Nagios mesmo ou alguma > ferramenta pra facilitar a configuração e deploy disso? Usa NRPE, > SNMP, NSCA ou o que? Faz monitoração distribuída ou tem apenas um > servidor? > > Se puder passar qualquer informação a respeito eu agradeço. Eu tenho > por volta de 200 servidores e 1500+ serviços em redes diferentes, > portanto mais do que um servidor de Nagios, e estou procurando uma > maneira prática de manter o serviço monitorando e gerando gráficos de > performance. Estou quase desistindo do Nagios e passando para algo > mais 'completo' como o Zabbix ou Zenoss. As vezes acho que o Nagios > precisa de um acabamento mais profissional pra ficar perfeito. > > Obrigado, > > Vinícius. > > 2008/2/20 Marcel <[EMAIL PROTECTED]>: > > Posso dizer com conhecimento de causa: Se a quantidade de servidores > > monitorados chegar perto de 1k, com um servidor dual-core, 4G e discos > SCSI, > > a solução de gráficos de performance (via Nagios) não escala. O ideal > para > > garantir escalabilidade é separar as funções. Monitoração/Notificação = > > Nagios, Gráficos de tendência => cacti/torrus/whatever (com IO > assíncrono), > > e o Nagios linka o gráfico correspondente via extended-info. > > > > ------------------------------------------------------------------------- > This SF.net email is sponsored by: Microsoft > Defy all challenges. Microsoft(R) Visual Studio 2008. > http://clk.atdmt.com/MRT/go/vse0120000070mrt/direct/01/ > -- > [email protected] mailing list > https://lists.sourceforge.net/lists/listinfo/nagios-users-br > Wiki: http://nagios-br.sf.net/wiki > ------------------------------------------------------------------------- This SF.net email is sponsored by: Microsoft Defy all challenges. Microsoft(R) Visual Studio 2008. http://clk.atdmt.com/MRT/go/vse0120000070mrt/direct/01/ -- [email protected] mailing list https://lists.sourceforge.net/lists/listinfo/nagios-users-br Wiki: http://nagios-br.sf.net/wiki
