Marius Stan wrote: > Andrei-Florian Staicu wrote: > > >>S-ar putea sa greshesc, dar nu face shi Webmin treaba asta? >> >> > > Se poate, dar, ca si nagios, mi se pare overkill. > Mi-am facut un script. > > > --- > Detalii despre listele noastre de mail: http://www.lug.ro/ >
Nagios este intr-adevar un instrument poate mult prea complex pentru o sarcina atat de punctuala. Are avantajul totusi ca poate fi extinsa configurarea ulterior pentru monitorizari mai complexe, pe mai multe masini. Verificarea starii unor servere numai prin lista proceselor mi se pare totusi excesiv de limitata. Un server de mail poate sa o ia pe aratura si sa nu mai raspunda pe portul de SMTP, cu toate ca procesul este inca in lista. Mi s-a mai intamplat o situatie similara si cu serverul de ftp - s-a rezolvat cu un restart. Faptul ca un proces este in lista nu inseamna neaparat ca serviciul functioneaza corect. Ar trebui ca serviciul tau de monitorizare sa vorbeasca limba fiecarui serviciu in parte si sa verifice starea lor (si eventual timpii de raspuns). Astfel, pentru http, te conectezi pe portul 80 si pe limba lui apache (http) ceri GET /index.html si verifici daca raspunde ok. Similar pentru SMTP - vezi daca primesti raspuns cu codul 220 pe portul 25. Nagios stie sa verifice mai mult decat lista de procese active. Te-ar putea ajuta pe tine poate si MON - http://www.kernel.org/software/mon/. Dar trebuie sa implementezi tu repornirea serviciilor in functie de alertele primite. Eu nu am folosit MON. Bogdan --- Detalii despre listele noastre de mail: http://www.lug.ro/
