On Sat, 24 Oct 2009 00:34:42 +0400
Artem Chuprina <r...@ran.pp.ru> wrote:

> Denis Feklushkin -> debian-russian@lists.debian.org  @ Sat, 24 Oct
> 2009 03:05:20 +0800:
> 
>  >>  >>  DF> А как мониторить ошибки? Есть много серверов, надо
>  >>  >>  DF> следить как бы чего не вышло. Появление ошибки в логе
>  >>  >>  DF> вполне себе признак что что-то случилось. Но как вы об
>  >>  >>  DF> этом узнаете?
>  >>  >> 
>  >>  >> Система мониторинга - это система роботов, которые регулярно
>  >>  >> проверяют _функционирование_ серверов.  То есть тот факт, что
>  >>  >> сервер обслуживает запросы так, как должен.  И сообщает она о
>  >>  >> том факте, что сервер не обслужил запрос, как положено.
>  >> 
>  >>  DF> Такая система никогда не будет проверять все возможные ошибки
>  >>  DF> (аналогия- борьба с багами в софте, когда никогда нельзя
>  >>  DF> сказать что в конкретной версии софта багов точно нет)
>  >> 
>  >> Денис, _никакая_ система никогда не будет проверять _все_
>  >> возможные ошибки.  Это математически неразрешимая задача.  Но
>  >> нужно не это. Нужно, чтобы сервер выполнял свои функции.  Если он
>  >> их выполняет, но ругается в лог - это менее страшно, чем если он
>  >> не ругается в лог, но не выполняет свои функции.
> 
>  DF> Не согласен. Лог в большинстве случаев будет информативнее и
>  DF> быстрее
> 
> - Ваша программа работает в 10 раз медленнее моей!
> - Да.  Но зато она работает ПРАВИЛЬНО.

Именно, это как раз иллюстрация к якобы медленной работе syslog :)
 
> Лог, вероятно, информативнее.  Если его мониторить - может быть, и
> быстрее.  Но очень не факт, что он таки поймает ошибку своевременно...

Мы уже договорились что одно другое не отменяет

>  >>  DF> не пофигу, т.к. в этом случае это систему придётся на каждую
>  >>  DF> машину ставить и настраивать. а при её смене ставить другую и
>  >>  DF> опять таки настраивать
>  >> 
>  >> Это тоже неправда.  Ничто, в общем, не мешает держать и,
>  >> соответственно, настраивать ее на машине мониторинга.  Уж это-то
>  >> даже теоретик должен бы сообразить...
> 
>  DF> Что за машина мониторинга? Уж не та ли эта машина, на которую
>  DF> стекаются логи с других машин? А как они туда стекаются, уж не
>  DF> сислогами ли удалённо?
> 
> Нет, это та машина, которая проверяет, что сервер отзывается так, как
> он должен отзываться.  А заодно может и в логи позаглядывать...
> Совершенно не обязательно имея их для этого локально.  man ssh, если
> чо...

Да, давайте придумаем свою собственную систему сбора логов взамен
существующией

> 
>  >>  >>  >>  DF> Потому что нормально когда 10 серверов и все сливают
>  >>  >>  >>  DF> логи (копии их) на одну машину где админ сможет
>  >>  >>  >>  DF> централизованно их прочесть перед началом рабочего
>  >>  >>  >>  DF> дня
>  >>  >>  >> 
>  >>  >>  >> Теоретик...
>  >>  >> 
>  >>  >>  DF> Да
>  >>  >> 
>  >>  >> Это вторая половина ответа на твой изначальный вопрос.
>  >>  >> "Потому что _на практике_ удобнее так, как сделано в
>  >>  >> дистрибутиве".
>  >> 
>  >>  DF> Пока обоснования логичного я не увидел.
>  >> 
>  >> А практику не нужно _логичное_ обоснование.  Если так удобнее -
>  >> ему пофигу, как это обосновывается, и обосновывается ли вообще.
> 
>  DF> Я допускаю другое объяснение: ни один маинтайнер не может
>  DF> заменить всю систему логгирования в дистрибутиве. Поэтому каждый
>  DF> из них вынужден следовать в общей канве.
> 
> Так никому и не надо менять всю систему логгирования.  Каждому
> достаточно поменять свою.  Если та система, на которую меняют, не
> позволяет это сделать удобно - значит, она плохая.

Согласен.

> 
> Только вот никому оно не надо, менять свою систему.
> 
>  >>  >>  Пакеты у нас,
>  >>  >> знаешь ли, мейнтейнят в основном те, кто их использует...  Ну
>  >>  >> и естественно, что в рамках соблюдения полиси мейнтейнер
>  >>  >> делает так, как удобнее ему на практике - а не в возвышенной
>  >>  >> теории.
>  >> 
>  >>  DF> Ну маразматиков то везде хватает, чего уж там )
>  >> 
>  >> Знаешь, есть, гм, подозрение, что маразматику не по силам
>  >> поддерживать работоспособными такие сложные пакеты, как apache и
>  >> samba.  Ты много сравнимых по сложности пакетов в Debian
>  >> поддерживаешь?
> 
>  DF> Полно случаев когда специалисты в своей области упираются рогом в
>  DF> какую-нибудь параллельную ничего не значащую хрень.
>  DF> (Вспоминается, например, автор оконного менеджера Ion)
> 
> Форкни и сделай свое.

Мне пока только причина интересна

>  Или вот, конструктивнее, сделай дополнение -
> хотя бы к нужным тебе демонам, - позволяющее при инсталляции включать
> логгинг сообразно локальной политике системы.  И перенастраивать его,
> опять же, глобально по всем демонам, эту систему поддерживающим.  И
> протолкни мейнтейнерам.  Невменяемых все же меньшинство, а
> большинство вполне согласится принять дополнение, ничего не ломающее,
> но добавляющее новую функциональность.
> 
> Глядишь, народу понравится, и к следующему релизу большинство демонов
> уже будут это уметь...
> 
>  >>  >>  >> У меня всего один сервер.  Но читать его логи по всем
>  >>  >>  >> сервисам перед началом рабочего дня нереально.  Вернее,
>  >>  >>  >> читать-то реально.  Нереально прочесть.
>  >>  >>  >> 
>  >>  >>  >>  DF> Софта много, ставится/удаляется он не редко, каждому
>  >>  >>  >>  DF> лазить в конфиг и перенастраивать устать можно. Или
>  >>  >>  >>  DF> того хуже - забыть что-то перенастроить на сислог и о
>  >>  >>  >>  DF> проблеме не узнать вообще
>  >>  >>  >> 
>  >>  >>  >> Ты и так о ней не узнаешь - у тебя либо слишком много
>  >>  >>  >> вывода, либо самое интересное будет зарезано настройкой,
>  >>  >>  >> сжимающей логи до уровня "реально прочесть".
>  >>  >> 
>  >>  >>  DF> Ошибки либо есть либо их нет.
>  >>  >> 
>  >>  >> Так ты не путай ошибки и сообщения об ошибках.  Это сильно не
>  >>  >> одно и то же.
>  >> 
>  >>  DF> Анноящие сообщения об ошибках, которые на самом деле не
>  >>  DF> свидетельствуют об ошибках ставятся в игнор (ровно так же
>  >>  DF> как и при "зарезании настройкой, сжимающей логи уровня
>  >>  DF> реально прочесть")
>  >> 
>  >> Ты и теоретик-то хреновый...  Тебе словосочетания "ошибка первого
>  >> рода" и "ошибка второго рода" что-нибудь говорят?
> 
>  DF> Тут у нас не статистика с миллиона машин а вполне конечное
>  DF> количество систем под единоначальным управлением, и однократное
>  DF> ложное срабатывание может служить сигналом к тому что надо бы его
>  DF> а) заигнорить и всё б) найти причину ложного срабатывания и
>  DF> устранить. И всего делов!
> 
> Еще раз.  "Ошибка первого рода" и "ошибка второго рода".
> 

Я ещё раз говорю - это тут не к месту, так как равно также оно применимо
и к твоей мысли о том что "самое интересное будет зарезано
настройкой сжимающей логи до уровня "реально прочесть"

Attachment: signature.asc
Description: PGP signature

Ответить