Re: [freebsd] Ошибки на 3ware 9690SA-4I при обычном копировании
On 02/05/14 14:30, Alexey Markov wrote: RAID: 3ware 9690SA-4I (512 Mb, BBU) Диски: 2 x WDC WD5002ABYS Сегодня в процессе подготовки к профилактике понадобилось скопировать один из небольших разделов (80 Гб) в конец диска. Запустил dd, и почти сразу сайт отвалился. В /var/log/messages в это время вижу: twa0: Request 0 timed out! twa0: INFO: (0x16: 0x1108): Resetting controller...: twa0: INFO: (0x04: 0x005E): Cache synchronization completed: unit=0 twa0: INFO: (0x04: 0x0001): Controller reset occurred: resets=2 В первую очередь имеет смысл посмотреть SMART на дисках, если данные 3ware позволяет это делать. Потом запустить по очереди на кождом из дисков тест (smartctl -t long) и еще раз посмотреть. В случае когда диски начинают умирать, RAID контроллеры могут писать в логах разные непонятные сообщения, от которых мало толку.
Re: [freebsd] ������ �� 3ware 9690SA-4I ��� ������� �����������
Hello, Anton! On February, 05 2014 at 14:35 you wrote to freebsd@uafug.org.ua: ?? RAID: 3ware 9690SA-4I (512 Mb, BBU) ?? Диски: 2 x WDC WD5002ABYS ?? ?? Сегодня в процессе подготовки к профилактике понадобилось скопировать ?? один из небольших разделов (80 Гб) в конец диска. Запустил dd, и почти ?? сразу сайт отвалился. В /var/log/messages в это время вижу: ?? twa0: Request 0 timed out! ?? twa0: INFO: (0x16: 0x1108): Resetting controller...: ?? twa0: INFO: (0x04: 0x005E): Cache synchronization completed: unit=0 ?? twa0: INFO: (0x04: 0x0001): Controller reset occurred: resets=2 AY В первую очередь имеет смысл посмотреть SMART на дисках, если данные AY 3ware позволяет это делать. AY Потом запустить по очереди на кождом из дисков тест (smartctl -t long) AY и еще раз посмотреть. smartmontools у меня запущен, в его логах только вот это: Feb 5 01:47:52 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_00], SMART Usage Attribute: 7 Seek_Error_Rate changed from 200 to 100 Feb 5 02:17:52 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_01], SMART Usage Attribute: 7 Seek_Error_Rate changed from 200 to 100 Feb 5 02:47:51 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_00], SMART Usage Attribute: 7 Seek_Error_Rate changed from 100 to 200 Feb 5 02:47:51 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_01], SMART Usage Attribute: 7 Seek_Error_Rate changed from 100 to 200 Feb 5 04:47:52 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_01], SMART Usage Attribute: 7 Seek_Error_Rate changed from 200 to 100 Feb 5 05:17:51 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_00], SMART Usage Attribute: 7 Seek_Error_Rate changed from 200 to 100 но такие записи у меня каждый день, и во время проблем с контроллером новых не появлялось. Посмотрел состояние дисков через smartctl -a, там тоже всё чисто. На всякий случай запустил smartctl -t long, через пару часов обещает закончить. Гугль сообщает, что похожие ошибки наблюдались на старых драйверах и прошивках, но были исправлены несколько лет назад. Драйвера в 8-ке и так последние от производителя, прошивку в контроллере можно и обновить, но саппорт LSI так и не ответил мне внятно, можно ли это делать на работающем сервере (с последующей перезагрузкой), или обязательно перепрошиваться из БИОС, а рисковать удалённым сервером в другой стране как-то не очень хочется. :-( Кстати, есть у кого-нибудь из присутствующих опыт перепрошивки 3ware контроллеров через tw_cli? -- WBR, Alexey Markov.
Re: [freebsd] Ошибки на 3ware 9690SA-4I при обычном копировании
Кстати, есть у кого-нибудь из присутствующих опыт перепрошивки 3ware контроллеров через tw_cli? через tw_cli прошивается нормально так прошивал 9650SE-2LP 9550SXU-4LP не той прошивкой он не даст прошить
Re: [freebsd] Ошибки на 3ware 9690SA-4I при обычном копировании
Привет On 02/05/14 13:13, Alexey Markov wrote: Гугль сообщает, что похожие ошибки наблюдались на старых драйверах и прошивках, но были исправлены несколько лет назад. Драйвера в 8-ке и так последние от производителя, прошивку в контроллере можно и обновить, но саппорт LSI так и не ответил мне внятно, можно ли это делать на работающем сервере (с последующей перезагрузкой), или обязательно перепрошиваться из БИОС, а рисковать удалённым сервером в другой стране как-то не очень хочется. :-( Кстати, есть у кого-нибудь из присутствующих опыт перепрошивки 3ware контроллеров через tw_cli? Контроллеры от 3ware довольно таки странные. 3-5 лет назад у меня было счастье в виде 10ка серверов с 3ware контроллерами как 8 так и 9й серии. OS - Linux + FreeBSD. Так вот раз в месяц-два отваливался винт на каком-то из серверов. Сначала винты меняли. Потом обратились к 3ware - посоветовали накатить прошивку на контроллере и на винтах. Сделал. Помогло, но не очень - реже. Причем если воткнуть дохлый винт в десктоп - работает годами. Закончился весь этот гемор сменой железа. P.S. firmware обновлял с livecd, т.к. был доступ к IP-KVM и нужно было проапдетфить как контроллер, так и диски.
[freebsd] Re: [freebsd] Ошибки на 3ware 9690SA-4I при обычном копировании
У меня была похожая беда - уже и не помню точно модель контроллера, винты стояли сас. В общем все работало без нареканий и черт меня дернул обновить прошивку. А до этого стояла какая-то бета, и решил - ну хуже ж не будет. Прошивку я естественно не сохранил, а потом найти ее уже не смог, хотя и долго искал. Сейчас контроллер валяется на полочке - постоянные ребилды рейда вряд-ли способствуют сохранности информации. В юниксах софтовые рейды уже давно работают как минимум - хорошо.
Re: [freebsd] ������ �� 3ware 9690SA-4I ��� ������� �����������
Hello, Alexander! On February, 05 2014 at 15:26 you wrote to freebsd@uafug.org.ua: ?? Кстати, есть у кого-нибудь из присутствующих опыт перепрошивки 3ware ?? контроллеров через tw_cli? AC через tw_cli прошивается нормально AC так прошивал 9650SE-2LP 9550SXU-4LP AC не той прошивкой он не даст прошить После прошивки контроллера сервер сразу перезагружать надо, или он некоторое время может поработать до плановой перезагрузки? А главное - при перепрошивке контроллера его настройки сохраняются, или их надо заново настраивать, как после прошивки БИОС-а на компе? -- WBR, Alexey Markov.
[freebsd] Re: [freebsd] Ошибки на 3ware 9690SA-4I при обычном копировании
После прошивки контроллера сервер сразу перезагружать надо, или он некоторое время может поработать до плановой перезагрузки? по перезагрузки А главное - при перепрошивке контроллера его настройки сохраняются, или их надо заново настраивать, как после прошивки БИОС-а на компе? ну у меня и разу не слетали. Если это успокоит :)
Re: [freebsd] FreeBSD-10+asterisk+chan_dongle issue
Приветствую сообщество! Для начала о плохом. (Всем кто давал свои рекомендации, ответ простой: ничего не заработало, даже если модуль собрался, он не загружался в сам астериск, ошибки все те же) Стандартным момпилятором в 10-ке clang-ом, собрать это все не представляется возможным. А для того чтобы собрать работоспособный модуль под 10-ой, мне понадобилось: pkg install gcc46 edit /etc/libmap.conf libgcc_s.so.1 gcc46/libgcc_s.so.1 libgomp.so.1gcc46/libgomp.so.1 libobjc.so.3gcc46/libobjc.so.2 libssp.so.0 gcc46/libssp.so.0 libstdc++.so.6 gcc46/libstdc++.so.6 edit /etc/make.conf .if !empty(.CURDIR:M/usr/ports/*) exists(/usr/local/bin/gcc46) CC=gcc46 CXX=g++46 CPP=cpp46 .endif cd /usr/ports/net/asterisk11 make install clean (да-да, знаю что оно притянет кучу пакетов и все они будут собраны gcc-ой) После чего собираем сам модуль с одной лишь опцией конфигурации: cd /tmp/asterisk-chan-dongle-asterisk11 ./configure CC=gcc46 make cp chan_dongle.so /usr/local/lib/asterisk/modules Ну и как результат test-10*CLI dongle show device devices version test-10*CLI dongle show version chan_dongle: Huawei 3G Dongle Channel Driver, Version 1.1, Revision 16 Project Home: http://code.google.com/p/asterisk-chan-dongle Bug Reporting: http://code.google.com/p/asterisk-chan-dongle/issues/list 2014-02-04 Volodymyr Kostyrko c.kw...@gmail.com: 04.02.2014 15:38, Nikita Olenets написав(ла): Спасибо за советы, сейчас перепробую каждую из предложенных вариантов и отпишусь. Ну тогда ещё в копилку. Не факт что ему настолько нужен iconv и возможно его можно просто выключить: ./configure --without-libiconv Просто насколько я помню описание iconv на m4 немного с костылями и может давать сбои. -- Sphinx of black quartz, judge my vow. -- Head of network resource management group Nikita Olenets z...@zeon.kiev.ua ZEON-UANIC ZEON-RIPE
Re: [freebsd] ������ �� 3ware 9690SA-4I ��� ������� �����������
Hello, Anton! On February, 05 2014 at 14:35 you wrote to freebsd@uafug.org.ua: ?? RAID: 3ware 9690SA-4I (512 Mb, BBU) ?? Диски: 2 x WDC WD5002ABYS ?? ?? Сегодня в процессе подготовки к профилактике понадобилось скопировать ?? один из небольших разделов (80 Гб) в конец диска. Запустил dd, и почти ?? сразу сайт отвалился. В /var/log/messages в это время вижу: ?? twa0: Request 0 timed out! ?? twa0: INFO: (0x16: 0x1108): Resetting controller...: ?? twa0: INFO: (0x04: 0x005E): Cache synchronization completed: unit=0 ?? twa0: INFO: (0x04: 0x0001): Controller reset occurred: resets=2 AY В первую очередь имеет смысл посмотреть SMART на дисках, если данные AY 3ware позволяет это делать. AY Потом запустить по очереди на кождом из дисков тест (smartctl -t long) AY и еще раз посмотреть. Прогнал длинные тесты на обоих винтах - ошибок нет. Похоже, дело не в них. Посмотрел через gstat, iostat и top -m io, что больше всего винт грузит. Оказалось, Постгрес постоянно что-то пишет на диск, причём с хорошей скоростью - до 15-20 мегабайт в секунду. Скорее всего, это WAL-ы для репликации со вторым сервером и сессии веб-движка. Подозреваю, что при запуске dd винты просто захлёбываются, упираясь в потолок по IOPS. Непонятно, правда, почему контроллер из-за этого дохнет. :-( Кстати, а можно ли как-то ограничить число операций ввода/вывода для процесса? Ну, типа nice, только не для ЦПУ, а для ввода/вывода. Или хотя бы измерить их число за определённый промежуток времени? -- WBR, Alexey Markov.
Re: [freebsd] ������ �� 3ware 9690SA-4I ��� ������� �����������
Hello, Vasiliy! On February, 05 2014 at 16:31 you wrote to Alexey Markov: ?? После прошивки контроллера сервер сразу перезагружать ?? надо, или он некоторое время может поработать до плановой ?? перезагрузки? VPM по перезагрузки Надеюсь, это означает может поработать ДО перезагрузки? ;-) ?? А главное - при перепрошивке контроллера его настройки ?? сохраняются, или их надо заново настраивать, как после ?? прошивки БИОС-а на компе? VPM ну у меня и разу не слетали. Если это успокоит :) Ох... У этого сервера вылезла ещё одна проблема, не получается попасть в БИОС через удалённую IPMI-консоль. Так что в случае неудачной прошивки контроллера я получу очень дорогой кирпич в очень далёкой стране. :-/ -- WBR, Alexey Markov.