Re: Zabbix: Server server_name is unreachable

2012-06-15 Пенетрантность Andrey Melnikoff
Павел Марченко bbl...@gmail.com wrote:
  то не знаю). К слову просто так айтемы не становятся not supported, к
  этому ведет или глобальное изменение конфигурации клиента (ОС
  сменилась), или же неверное изменение конфигурации мониторинга. Во
  А у меня - пропадают. на localhost в zabbix_agent есть:
  UserParameter=UserP.procmem[*], ps aux |grep $1|grep -v grep|awk 
  '{sum+=$$6} END {print sum}'
  который после некоторого времени просто переходит в not supported. тихо так
  переходит, по партизански. Используется этот итем для монтиоринга
  потребляемой zabbix_agetd памяти.
 наталкивался на такое, возможно у забикс пользователя в системе нету
 шелла/прав, поэтому и выполнить не может, вторая причина в конфиге
 клиента не прописан ip и порт для active check, и третья файрволится
 порт для  active check
Есть прав, он от рута работает. И порты прописаны и на lo фаирвола нету. Оно
ведь после запуска работает, а через некоторое время - перестает.

  Пойдем дальше: менджмент сетка для всяких свичей - /19, это 8190 хостов,
  на опрос несуществующего хоста тратиться 6-7 секунд времени. Завершиться

 пропиши в конфиге сервера больше процессов дискавери(хотя уже не
 помню, это вроде в 2.0 появилось), как вариант распределять нагрузку
 по нодам или проксям.
nmap отработал всё простарнство за 45 минут, забикс таки за свои 13 часов.
Если прописывать больше одного discovery - то надо поднимать штук n+1
discovery процессов, а оно само не умеет.

  процесс часов через 13. Дальше - интересней, по итогам SNMP запроса надо
  рассортировать железки по типам и дабвить в разные группы. А тут засада -
  оперировать можно только одинм ответом. Тоесть, прийдется писать скрипт,
  который будет ходить через json за свежими хостами, и обновлять базу.
  Внимание вопрос - где от этого процесса (discovery) хоть какая-то выгода?
  Быстрее нарисовать скриптик с nmap+snmpwalk и натрамбовать всё в базу.
 в 2.0 с snmp стало получше, с дискавери ненарадуюсь, автоматом цепляет
 мои микротики находит все интерфейсы, по регекспу нужные ставит на
 мониторинг. snmp трапы не использую. опрашивает девайсы сам забикс.
У тебя - микротики, у меня - сборная солянка из свичей, которые надо
опознать, прицепить нужный темплейт и еще обозвать, чтоб не наблюдать соти
хостов вида 192.168.x.y. В идеале - разбить по группам в зависимости от
sytemLocation, но это не в этой софтине.

 есть косяки, но наверно это больше не косяк забикса я скрипта
 мониторинга рейдов на ESX. мониторится с другой линуховой(centos)
 виртуалки, при частой проверке скрипт перестаёт возвращать данные, в
 следствии чего nodata на тригере, решаю ребутом этой виртуалки раз в
 сутки(она собственно только и мониторит рейды)
Вот тебе такой-же пример, как оно тихо умирает. ты параметр через zabbix_get
ручками дерни и посмотри, что он тебе расскажет? ZBX_NOTSUPPORTED ?

 Пы.Сы. хосты я добавляю не скопом, т.к. в большинстве под каждый свои 
 параметры
Приехали. Это у нас 21 век на дворе или как? А всё вручную.


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive: http://lists.debian.org/pdnra9-7nk@kenga.kmv.ru



Fwd: Zabbix: Server server_name is unreachable

2012-06-15 Пенетрантность Павел Марченко
 есть косяки, но наверно это больше не косяк забикса я скрипта
 мониторинга рейдов на ESX. мониторится с другой линуховой(centos)
 виртуалки, при частой проверке скрипт перестаёт возвращать данные, в
 следствии чего nodata на тригере, решаю ребутом этой виртуалки раз в
 сутки(она собственно только и мониторит рейды)
 Вот тебе такой-же пример, как оно тихо умирает. ты параметр через zabbix_get
 ручками дерни и посмотри, что он тебе расскажет? ZBX_NOTSUPPORTED ?

забикс все дергает нормально. данных нет на выходе скрипта в следствии
чего в базу вносится пустое значение, not suported не поднимается. при
этом если залогинится на тачку и выполнить скрипт под рутом, то также
ничего не возвращает, решается только ребутом, хотя никаих процессов
после выполнения скрипта не остается.

 Пы.Сы. хосты я добавляю не скопом, т.к. в большинстве под каждый свои 
 параметры
 Приехали. Это у нас 21 век на дворе или как? А всё вручную.
просто на мониторинг хосты так поступают мне все мониторить не нужно,
а вот когда поступит запрос от ответсвенного за сервис человека, тогда
цже и думаем что с хостом делать.


--
В смысле осмысления бессмысленного смысл тоже имеет определенную
осмысленность!!!


-- 
В смысле осмысления бессмысленного смысл тоже имеет определенную
осмысленность!!!


Re: Zabbix: Server server_name is unreachable

2012-06-14 Пенетрантность Павел Марченко
 Вот сейчас сижу моделирую аварию и тихо фигею с того, как это работает.
 Добавленные итемы не опрашиваются сразу, а только через временной интервал
 опроса. Итемы в состоянии not supported надо искать вручную, причем - если
 это из темплйта - то в темплейте видно, что оно not supported, а в самом
 хосте - нет.
not supported не нужно искать в ручную, достаточно посмотреть latest
data, not supported из тэплейта видно так же и в хосте (пример в
аттаче). Система мощная и гибкая.




-- 
В смысле осмысления бессмысленного смысл тоже имеет определенную
осмысленность!!!
attachment: 14.06.png

Re: Zabbix: Server server_name is unreachable

2012-06-14 Пенетрантность Andrey Melnikoff
Павел Марченко bbl...@gmail.com wrote:
 [-- text/plain, кодировка base64, кодировка: KOI8-R, 11 строк --]

  Вот сейчас сижу моделирую аварию и тихо фигею с того, как это работает.
  Добавленные итемы не опрашиваются сразу, а только через временной интервал
  опроса. Итемы в состоянии not supported надо искать вручную, причем - если
  это из темплйта - то в темплейте видно, что оно not supported, а в самом
  хосте - нет.
 not supported не нужно искать в ручную, достаточно посмотреть latest
 data, not supported из тэплейта видно так же и в хосте (пример в
 аттаче). Система мощная и гибкая.
Система черезжопистая. У меня хостов - под 400 штук, хостгрупп - несколько
десятков. И в предложеной задаче - я должен вручную перебрать все хостгруппы
и отсмотреть, у каких хостов что там NOT_SUPPORTED. 
А про тихий переход из состояния active - not supported вся эта система
скромно молчит. То, что параметры перестали сниматься - да и фиг с ними. Или
прикажете на каждый параметр триггер рисовать?

Вот сейчас смотрю на дашбоард - серверов с проблемой 2. А должно быть - три.
ибо один из хостов (gw) за которым находятся хосты host1  host2 - в дауне,
соотвественно host1 и gw - в дауне, про host2 - всё хорошо, за исключением
того, что в Hosts-Configuration светится красный квадрат с гордой
подсказкой Get value from agent failed: *** Cannot connect to 
[[x.x.x.x]:10052]: 
[4] Interrupted system call. Где алерт-то? И так уже сутки.


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive: http://lists.debian.org/0d5pa9-m5c@kenga.kmv.ru



Re: Zabbix: Server server_name is unreachable

2012-06-14 Пенетрантность Павел Марченко
 Вот сейчас смотрю на дашбоард - серверов с проблемой 2. А должно быть - три.
 ибо один из хостов (gw) за которым находятся хосты host1  host2 - в дауне,
 соотвественно host1 и gw - в дауне, про host2 - всё хорошо, за исключением
 того, что в Hosts-Configuration светится красный квадрат с гордой
 подсказкой Get value from agent failed: *** Cannot connect to 
 [[x.x.x.x]:10052]:
 [4] Interrupted system call. Где алерт-то? И так уже сутки.

Судя по всему выставлены зависимости тригеров, т.е. если хосты А и Б
находятся за gw, а gw в дауне, то тригеры на А и Б подниматься не
будут. Но это если настроено так. Если не настроено, то нужно копать,
айтемы на предмет времени проверки (может там чек раз в сутки, деталей
то не знаю). К слову просто так айтемы не становятся not supported, к
этому ведет или глобальное изменение конфигурации клиента (ОС
сменилась), или же неверное изменение конфигурации мониторинга. Во
втором случае виноват не инструмент, а тот кто его в руках держал, ибо
все изменения обкатывать на тестовой группе нужно.
Я тоже немало хостов мониторю, но не сталкивался с подобными проблемами.

З.Ы. Перешел уже на 2.0.0
-- 
В смысле осмысления бессмысленного смысл тоже имеет определенную
осмысленность!!!


Re: Zabbix: Server server_name is unreachable

2012-06-14 Пенетрантность Andrey Melnikoff
Павел Марченко bbl...@gmail.com wrote:
  Вот сейчас смотрю на дашбоард - серверов с проблемой 2. А должно быть - три.
  ибо один из хостов (gw) за которым находятся хосты host1  host2 - в дауне,
  соотвественно host1 и gw - в дауне, про host2 - всё хорошо, за исключением
  того, что в Hosts-Configuration светится красный квадрат с гордой
  подсказкой Get value from agent failed: *** Cannot connect to 
  [[x.x.x.x]:10052]:
  [4] Interrupted system call. Где алерт-то? И так уже сутки.

 Судя по всему выставлены зависимости тригеров, т.е. если хосты А и Б
 находятся за gw, а gw в дауне, то тригеры на А и Б подниматься не
 будут. Но это если настроено так. Если не настроено, то нужно копать,
Рассказываю. Зависимостей нет. Я еще в здравом уме, чтоб их не делать (да и
нужны они в большей части только для карт).

 айтемы на предмет времени проверки (может там чек раз в сутки, деталей
У host2 был отключен тригер на событие доступности агнета. По каким причиним
- не ясно, но соль не в этом. После его включения (хост недоступен, агент
- тоже) - он так и остался в состоянии UP. Со стороны вебморды - выглядело
красиво: все итемы с этого хоста красные, а этот - зеленый. Интервал опроса
- 5 минут, провисело до утра, состояние не изменилось.

 то не знаю). К слову просто так айтемы не становятся not supported, к
 этому ведет или глобальное изменение конфигурации клиента (ОС
 сменилась), или же неверное изменение конфигурации мониторинга. Во
А у меня - пропадают. на localhost в zabbix_agent есть:
UserParameter=UserP.procmem[*], ps aux |grep $1|grep -v grep|awk '{sum+=$$6} 
END {print sum}'
который после некоторого времени просто переходит в not supported. тихо так
переходит, по партизански. Используется этот итем для монтиоринга
потребляемой zabbix_agetd памяти.

 втором случае виноват не инструмент, а тот кто его в руках держал, ибо
 все изменения обкатывать на тестовой группе нужно.
 Я тоже немало хостов мониторю, но не сталкивался с подобными проблемами.
Руками небось добавлял? Я вот сейчас все прелести Discovery через SNMP
испытываю. Тихий, мдленный ужас. Как оказалось (в 2.0 та-же
ситуация) - утуре дисковер однопоточный. То есть, один хост за один заход.
Они даже event FSM не осилили там написать. Та-же net-snmp успешно умеет
опрашивать сразу десятками хосты, в один момент времени. все остальные
poller'ы - такие-же. 

Пойдем дальше: менджмент сетка для всяких свичей - /19, это 8190 хостов,
на опрос несуществующего хоста тратиться 6-7 секунд времени. Завершиться
процесс часов через 13. Дальше - интересней, по итогам SNMP запроса надо
рассортировать железки по типам и дабвить в разные группы. А тут засада -
оперировать можно только одинм ответом. Тоесть, прийдется писать скрипт,
который будет ходить через json за свежими хостами, и обновлять базу.
Внимание вопрос - где от этого процесса (discovery) хоть какая-то выгода?
Быстрее нарисовать скриптик с nmap+snmpwalk и натрамбовать всё в базу.

 З.Ы. Перешел уже на 2.0.0
Не-не-не, с этим - как с виндой, до первого сервиспака - низзя. Гляжу в
багтрекер и радуюсь, что не побежал апгрейдиться.

PS: на самом деле zabbix хороший пример, что нельзя всё делать на C. Большая
часть задач может быть решена на языках более высокого уровня
(perl/php/python) гораздо эффективней и быстрей. Но - мы имеем то что имеем: 
убогие триггеры, неудобную вебморду, маленькую гибкость. Но - НАХАЛЯВУ!


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive: http://lists.debian.org/u3qpa9-csd@kenga.kmv.ru



Re: Zabbix: Server server_name is unreachable

2012-06-14 Пенетрантность Павел Марченко
 то не знаю). К слову просто так айтемы не становятся not supported, к
 этому ведет или глобальное изменение конфигурации клиента (ОС
 сменилась), или же неверное изменение конфигурации мониторинга. Во
 А у меня - пропадают. на localhost в zabbix_agent есть:
 UserParameter=UserP.procmem[*], ps aux |grep $1|grep -v grep|awk 
 '{sum+=$$6} END {print sum}'
 который после некоторого времени просто переходит в not supported. тихо так
 переходит, по партизански. Используется этот итем для монтиоринга
 потребляемой zabbix_agetd памяти.
наталкивался на такое, возможно у забикс пользователя в системе нету
шелла/прав, поэтому и выполнить не может, вторая причина в конфиге
клиента не прописан ip и порт для active check, и третья файрволится
порт для  active check

 Пойдем дальше: менджмент сетка для всяких свичей - /19, это 8190 хостов,
 на опрос несуществующего хоста тратиться 6-7 секунд времени. Завершиться

пропиши в конфиге сервера больше процессов дискавери(хотя уже не
помню, это вроде в 2.0 появилось), как вариант распределять нагрузку
по нодам или проксям.

 процесс часов через 13. Дальше - интересней, по итогам SNMP запроса надо
 рассортировать железки по типам и дабвить в разные группы. А тут засада -
 оперировать можно только одинм ответом. Тоесть, прийдется писать скрипт,
 который будет ходить через json за свежими хостами, и обновлять базу.
 Внимание вопрос - где от этого процесса (discovery) хоть какая-то выгода?
 Быстрее нарисовать скриптик с nmap+snmpwalk и натрамбовать всё в базу.
в 2.0 с snmp стало получше, с дискавери ненарадуюсь, автоматом цепляет
мои микротики находит все интерфейсы, по регекспу нужные ставит на
мониторинг. snmp трапы не использую. опрашивает девайсы сам забикс.

есть косяки, но наверно это больше не косяк забикса я скрипта
мониторинга рейдов на ESX. мониторится с другой линуховой(centos)
виртуалки, при частой проверке скрипт перестаёт возвращать данные, в
следствии чего nodata на тригере, решаю ребутом этой виртуалки раз в
сутки(она собственно только и мониторит рейды)

Пы.Сы. хосты я добавляю не скопом, т.к. в большинстве под каждый свои параметры

-- 
В смысле осмысления бессмысленного смысл тоже имеет определенную
осмысленность!!!


Re: Zabbix: Server server_name is unreachable

2012-06-13 Пенетрантность Yury O. Tabolin

13.06.2012 08:53, Korona Auto Ltd.\ Andrey N. Prokofiev пишет:
День  добрый. Стоит zabbix сервер из сквизи. По нескольким хостам 
(прежде всего под windows) zabbix периодически валят сообщениями 
Server server_name is unreachable. Не очень понятно какой триггер 
срабатывает и каким образом проверяется доступность. Что скажете по 
этому поводу?




Тригер можно посмотреть в настройках триггеров конкретного узла в 
вэб-морде заббикса. Если ничего не меняли то триггер unreachable 
зависит от элемента данных Host status, информация берется из 
заббикс-агента на конкретном хосту. Надо смотреть в сторону агента, не 
помню можно ли поглядеть логи у виндового агента, если есть возможность 
- надо курить их.



---
С уважением,
Таболин Юрий Олегович
системный администратор
МУП г.Ижевска Ижевские электрические сети


--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive: http://lists.debian.org/4fd82e47.1010...@ies.udm.ru



Re: Zabbix: Server server_name is unreachable

2012-06-13 Пенетрантность Павел Марченко
Это скорее всего айтем Host status, он часто валит ошибки из-за
пропадания связи с агентом(потеря пакетов или ненадежное соединение),
дабы исключить ложные срабатывания делаю агрегированный айтем от Host
status и на основе агрегата уже создаю триггер

13 июня 2012 г., 9:08 пользователь Yury O. Tabolin dan...@ies.udm.ru написал:
 13.06.2012 08:53, Korona Auto Ltd.\ Andrey N. Prokofiev пишет:

 День  добрый. Стоит zabbix сервер из сквизи. По нескольким хостам (прежде
 всего под windows) zabbix периодически валят сообщениями Server
 server_name is unreachable. Не очень понятно какой триггер срабатывает и
 каким образом проверяется доступность. Что скажете по этому поводу?


 Тригер можно посмотреть в настройках триггеров конкретного узла в вэб-морде
 заббикса. Если ничего не меняли то триггер unreachable зависит от элемента
 данных Host status, информация берется из заббикс-агента на конкретном
 хосту. Надо смотреть в сторону агента, не помню можно ли поглядеть логи у
 виндового агента, если есть возможность - надо курить их.


 ---
 С уважением,
 Таболин Юрий Олегович
 системный администратор
 МУП г.Ижевска Ижевские электрические сети



 --
 To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
 with a subject of unsubscribe. Trouble? Contact
 listmas...@lists.debian.org
 Archive: http://lists.debian.org/4fd82e47.1010...@ies.udm.ru




-- 
В смысле осмысления бессмысленного смысл тоже имеет определенную
осмысленность!!!


Re: Zabbix: Server server_name is unreachable

2012-06-13 Пенетрантность Andrey Melnikoff
Korona Auto Ltd.\\ Andrey N. Prokofiev a...@korona-auto.com wrote:
 День  добрый. Стоит zabbix сервер из сквизи. По нескольким хостам 
 (прежде всего под windows) zabbix периодически валят сообщениями Server 
 server_name is unreachable. Не очень понятно какой триггер 
 срабатывает и каким образом проверяется доступность. Что скажете по 
 этому поводу?
Ооо, черезжопистость интерфейса у этой интерпрайз реди поделки поражает.

В dashboard, когда появилось событие, в табличке Last 20 issues давишь на
время появления события - открывается Latest events, там опять давишь
время появления события. Откроется Event Source Details, там в строчке с
Expression будет сработавший триггер. на него можно нажать и попадешь в
items configuration. А дальше в зависимости откуда растет этот триггер (из
темплейтов или сам по себе) его можно отредактировать, или ткнуть в заголовке
на ссылку шаблона - отредактировать его там.

Вот сейчас сижу моделирую аварию и тихо фигею с того, как это работает.
Добавленные итемы не опрашиваются сразу, а только через временной интервал
опроса. Итемы в состоянии not supported надо искать вручную, причем - если
это из темплйта - то в темплейте видно, что оно not supported, а в самом
хосте - нет.


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive: http://lists.debian.org/nh1na9-ut4@kenga.kmv.ru



Re: Zabbix: Server server_name is unreachable

2012-06-12 Пенетрантность Dmitry A. Zhiglov
13 июня 2012 г., 8:53 пользователь Korona Auto Ltd.\ Andrey N.
Prokofiev a...@korona-auto.com написал:
 День  добрый. Стоит zabbix сервер из сквизи. По нескольким хостам (прежде
 всего под windows) zabbix периодически валят сообщениями Server
 server_name is unreachable. Не очень понятно какой триггер срабатывает и
 каким образом проверяется доступность. Что скажете по этому поводу?

Может быть это?
http://forum.ubuntu.ru/index.php?topic=92033.0

или это?
http://www.zabbix.com/forum/showthread.php?t=22356