Marius Stan wrote:
> Andrei-Florian Staicu wrote:
> 
> 
>>S-ar putea sa greshesc, dar nu face shi Webmin treaba asta?
>> 
>>
> 
> Se poate, dar, ca si nagios, mi se pare overkill.
> Mi-am facut un script.
> 
> 
> --- 
> Detalii despre listele noastre de mail: http://www.lug.ro/
> 

Nagios este intr-adevar un instrument poate mult prea complex pentru o 
sarcina atat de punctuala. Are avantajul totusi ca poate fi extinsa 
configurarea ulterior pentru monitorizari mai complexe, pe mai multe masini.

Verificarea starii unor servere numai prin lista proceselor mi se pare 
totusi excesiv de limitata. Un server de mail poate  sa o ia pe aratura 
si sa nu mai raspunda pe portul de SMTP, cu toate ca procesul este inca 
in lista. Mi s-a mai intamplat o situatie similara si cu serverul de ftp 
- s-a rezolvat cu un restart. Faptul ca un proces este in lista nu 
inseamna neaparat ca serviciul functioneaza corect.

Ar trebui ca serviciul tau de monitorizare sa vorbeasca limba fiecarui 
serviciu in parte si sa verifice starea lor (si eventual timpii de 
raspuns). Astfel, pentru http, te conectezi pe portul 80 si pe limba lui 
apache (http) ceri GET /index.html si verifici daca raspunde ok. Similar 
pentru SMTP - vezi daca primesti raspuns cu codul 220 pe portul 25.

Nagios stie sa verifice mai mult decat lista de procese active. Te-ar 
putea ajuta pe tine poate si MON - http://www.kernel.org/software/mon/. 
Dar trebuie sa implementezi tu repornirea serviciilor in functie de 
alertele primite. Eu nu am folosit MON.

Bogdan

--- 
Detalii despre listele noastre de mail: http://www.lug.ro/


Raspunde prin e-mail lui