OT: Czym monitorujecie serwery?
Witam, Czego używacie do monitorowania swoich serwerków? Teraz używam nagiosa, smokeping i cacti - każdy ma swoje zady i walety i zakresy zastosowań: - smokeping: fajny, porządne wykresy, ale nie da się (albo nie znalazłem ani google nie zna takiej możliwości) definiować użytkowników którym udostępniałbym tylko część danych, problemy gdy chciałoby się zmienić częstotliwość próbkowania (albo wszystkie wykresy idą do śmieci albo trzeba się bawić w importy/eksporty), trochę upierdliwe i niezbyt elastyczne dodawanie nowych testów, ograniczony zakres zastosowań - nagios: szybka konfiguracja przez pliki, bezproblemowe rozszerzanie listy testów za pomocą nrpe (lokalnego agenta), można np. sobie na każdym serwerze zdefiniować inną listę filesystemów do sprawdzania wolnego miejsca, inne komendy do sprawdzania poprawności działania RAIDów (czy to soft, czy hardware), własne testy (np. raportowanie czy wykonały się nocne backupy). Niestety - wady to trzy stany (OK, WARNING, ERROR, no dobra - cztery stany bo jest UNKNOWN), brak możliwości monitorowania wydajności (obciążenie systemu, czasy odpowiedzi apache'a itp.) - cacti: bardzo ładne monitorowanie mnóstwa parametrów, porządne wykresy. Wady: wszystko jest badane po snmp (albo przez http), więc gdy serwer nagios nie ma łączności z badanym serwerem to mamy dziury w wykresach (najczęściej tam gdzie właśnie najbardziej nas interesuje co się działo). Do tego KOSZMARNA konfiguracja - wszystko się wyklikuje, nawet jak się przygotuje host template to potem czeka człowieka w porywach do pół godziny klikania, plus pamiętanie co i w jakiej kolejności zrobić żeby wykresy się w ogóle pojawiły. A jak się czasami zrobi coś nie tak (np. skasuje serwis z listy) to w ogóle amba, dochodź człowieku jak to przywrócić... BTW, jak jest z cacti w PLD? Nadal nie da się zainstalować: Przygotowywanie... ## [100%] 1:cacti-plugin-boost ## [ 20%] Adding user cacti UID=184. 2:cacti ## [ 40%] FATAL: Cannot connect to MySQL server on 'localhost'. Please make sure you have specified a valid MySQL database name in 'include/config.php' Przeładowanie usługi Lighttpd Web Server. [ ZROBIONE ] 3:cacti-spine## [ 60%] 4:cacti-doc ## [ 80%] 5:cacti-setup## [100%] I bądź tu mądry co z nim zrobić :( Jest jeszcze zabbix: niby fajny, ma dobrze przemyślany interfejs na którym bardzo dużo widać na jednym ekranie, konfiguracja nawet jest znośna, ale... jest cholernie sztywny - nie zdefiniujesz sobie własnego testu i już. Ba - od bardzo dawna ludzie błagają o testy np. IMAPs, a tu niestety niedasie i porady żeby sobie testować samego IMAPa albo sprawdzać czy da się połączyć z portem 993 (co wcale nie musi oznaczać że IMAPs działa). Nagios potrafi nie tylko się połączyć ale nawet zalogować do testowej skrzynki i sprawdzić czy wszystko się zgadza... Jakieś inne propozycje? Szukałem różnych opcji - bezpłatnych, choć nie wykluczam czegoś co by było w miarę niedrogie (a nie jak nagios XI w cenie od 1000$)... Pozdrawiam, -- Jacek Osiecki jos...@ceti.pl GG:3828944 I don't want something I need. I want something I want.___ pld-users-pl mailing list pld-users-pl@lists.pld-linux.org http://lists.pld-linux.org/mailman/listinfo/pld-users-pl
Re: OT: Czym monitorujecie serwery?
Dnia Wednesday 08 of February 2012, Jacek Osiecki napisał: - nagios: szybka konfiguracja przez pliki, bezproblemowe rozszerzanie listy testów za pomocą nrpe (lokalnego agenta), można np. sobie na każdym serwerze zdefiniować inną listę filesystemów do sprawdzania wolnego miejsca, inne komendy do sprawdzania poprawności działania RAIDów (czy to soft, czy hardware), własne testy (np. raportowanie czy wykonały się nocne backupy). Niestety - wady to trzy stany (OK, WARNING, ERROR, no dobra - cztery stany bo jest UNKNOWN), brak możliwości monitorowania wydajności (obciążenie systemu, czasy odpowiedzi apache'a itp.) Byzydura :) Za pomocą nagiosa możesz monitorować nawet temperaturę za oknem czy obroty wiertarki. Konieczne są 2 rzeczy: monitorowana rzecz z odpalonym Linuksem i plugin NRPE. Do obciążenia systemu można stosować choćby wbudowany check_load. Generalnie dużą część pluginów można napisać w 2h samemu. Polecam Pythona. Nadaje się do tego GENIALNIE. Jeśli przyjmiemy, że: – 0, oznaczające normalną pracę – 1, ostrzeżenie – 2, stan krytyczny – 3, stan nieustalony To przykładowy opis algorytmu pomiaru danego stanu będzie wyglądał tak: - ustawienie dla zwracanego stanu wartości 3. - próba pobrania próbki do monitorowania, której niepowodzenie zwraca aktualnie ustalony stan i kończy algorytm. - obróbka (parsowanie) uzyskanych danych. - próba przyrównania uzyskanej wartości do jednej z wartości zadanych, której niepowodzenie ustawia zwracany stan do wartości 1 i kończy algorytm. - zwrócenie stanu uzyskanego w ostatniej próbie i zakończenie algorytmu. Dla mnie 4 stany w zupełności wystarczają, aby wszcząć czerwony alarm, zerknąć na maszynę lub spokojnie pić kawę ;-) -- Pozdrawiam, Wojciech Błaszkowski www.blaszkowski.com GSM: +48 600 197 207 JID: wojt...@jabber.biz.pl ___ pld-users-pl mailing list pld-users-pl@lists.pld-linux.org http://lists.pld-linux.org/mailman/listinfo/pld-users-pl
Re: OT: Czym monitorujecie serwery?
On 02/08/12 13:41, Jacek Osiecki wrote: Witam, - nagios: szybka konfiguracja przez pliki, bezproblemowe rozszerzanie listy testów za pomocą nrpe (lokalnego agenta), można np. sobie na każdym serwerze zdefiniować inną listę filesystemów do sprawdzania wolnego miejsca, inne komendy do sprawdzania poprawności działania RAIDów (czy to soft, czy hardware), własne testy (np. raportowanie czy wykonały się nocne backupy). Niestety - wady to trzy stany (OK, WARNING, ERROR, no dobra - cztery stany bo jest UNKNOWN), brak możliwości monitorowania wydajności (obciążenie systemu, czasy odpowiedzi apache'a itp.) Monitorowanie wydajności jest właśnie przez stany. Do wykresów używam nagios + nagios-pnp4. Jedyna wada to dameon npcd, który raz na pół roku potrafi się zawiesić i wymaga restartu. Wystarczy go monitorować nagiosem. pozdrawiam, Łukasz ___ pld-users-pl mailing list pld-users-pl@lists.pld-linux.org http://lists.pld-linux.org/mailman/listinfo/pld-users-pl
Re: OT: Czym monitorujecie serwery?
Jest jeszcze zabbix: niby fajny, ma dobrze przemyślany interfejs na którym bardzo dużo widać na jednym ekranie, konfiguracja nawet jest znośna, ale... jest cholernie sztywny - nie zdefiniujesz sobie własnego testu i już. Ba - od bardzo dawna ludzie błagają o testy np. IMAPs, a tu niestety niedasie i porady żeby sobie testować samego IMAPa albo sprawdzać czy da się połączyć z portem 993 (co wcale nie musi oznaczać że IMAPs działa). Nagios potrafi nie tylko się połączyć ale nawet zalogować do testowej skrzynki i sprawdzić czy wszystko się zgadza... Zabbixa używam od dawna, aczkolwiek wykorzystuję tylko ułamek jego możliwości. Nagiosa nie trawiłem ze względu na zakręconą (dla mnie) konfigurację niepotrzebnie komplikującą proste rzeczy oraz dlatego, że bardzo często dawał mi fałszywe alarmy. Jeżeli chodzi o własne testy to zabbix jest dla mnie idealny bo pozwala podpiąć dowolny skrypt, zwracający dowolne wartości i na ich podstawie powodujący triggery takie jakie chcę. Dzięki temu mogę monitorować wszystko co mi przyjdzie na myśl i tak na przykład monitoruję sobie poprawność logowania do różnych usług, poprawność rozwiązywania nazw na moich serwerach DNS, poprawność działania sieciowych zasobów dyskowych itp. Jeżeli szukasz rozwiązania, które out of the box będzie monitorować Ci wszystko to zapomnij - nie ma takiego. Mam oczywiście na myśli darmowe. Płatnymi się nigdy nie interesowałem więc nie mam pojęcia jak tam sytuacja wygląda. Jeżeli jednak nie straszne Ci jest pisanie skryptów w bashu, perlu, pythonie, php czy tcl (zależy co kto lubi) to polecam zabbixa. Ja jak napisałem swój zestaw skryptów jakieś trzy lata temu tak od tamtej pory je tylko podpinam i z zabbixa rozmawiam z nimi via SNMP. M. ___ pld-users-pl mailing list pld-users-pl@lists.pld-linux.org http://lists.pld-linux.org/mailman/listinfo/pld-users-pl