Re: [freebsd] Ошибки на 3ware 9690SA-4I при обычном копировании

2014-02-05 Пенетрантность Anton Yuzhaninov

On 02/05/14 14:30, Alexey Markov wrote:

RAID: 3ware 9690SA-4I (512 Mb, BBU)
Диски: 2 x WDC WD5002ABYS

Сегодня в процессе подготовки к профилактике понадобилось скопировать
один из небольших разделов (80 Гб) в конец диска. Запустил dd, и почти
сразу сайт отвалился. В /var/log/messages в это время вижу:
twa0: Request 0 timed out!
twa0: INFO: (0x16: 0x1108): Resetting controller...:
twa0: INFO: (0x04: 0x005E): Cache synchronization completed: unit=0
twa0: INFO: (0x04: 0x0001): Controller reset occurred: resets=2


В первую очередь имеет смысл посмотреть SMART на дисках, если данные 3ware 
позволяет это делать.


Потом запустить по очереди на кождом из дисков тест (smartctl -t long) и еще раз 
посмотреть.


В случае когда диски начинают умирать, RAID контроллеры могут писать в логах 
разные непонятные сообщения, от которых мало толку.


Re: [freebsd] ������ �� 3ware 9690SA-4I ��� ������� �����������

2014-02-05 Пенетрантность Alexey Markov

Hello, Anton!
On February, 05 2014 at 14:35 you wrote to freebsd@uafug.org.ua:

?? RAID: 3ware 9690SA-4I (512 Mb, BBU)
?? Диски: 2 x WDC WD5002ABYS
??
?? Сегодня в процессе подготовки к профилактике понадобилось скопировать
?? один из небольших разделов (80 Гб) в конец диска. Запустил dd, и почти
?? сразу сайт отвалился. В /var/log/messages в это время вижу:
?? twa0: Request 0 timed out!
?? twa0: INFO: (0x16: 0x1108): Resetting controller...:
?? twa0: INFO: (0x04: 0x005E): Cache synchronization completed: unit=0
?? twa0: INFO: (0x04: 0x0001): Controller reset occurred: resets=2

AY В первую очередь имеет смысл посмотреть SMART на дисках, если данные
AY 3ware позволяет это делать.

AY Потом запустить по очереди на кождом из дисков тест (smartctl -t long)
AY и еще раз посмотреть.

smartmontools у меня запущен, в его логах только вот это:

Feb  5 01:47:52 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_00], SMART 
Usage Attribute: 7 Seek_Error_Rate changed from 200 to 100
Feb  5 02:17:52 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_01], SMART 
Usage Attribute: 7 Seek_Error_Rate changed from 200 to 100
Feb  5 02:47:51 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_00], SMART 
Usage Attribute: 7 Seek_Error_Rate changed from 100 to 200
Feb  5 02:47:51 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_01], SMART 
Usage Attribute: 7 Seek_Error_Rate changed from 100 to 200
Feb  5 04:47:52 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_01], SMART 
Usage Attribute: 7 Seek_Error_Rate changed from 200 to 100
Feb  5 05:17:51 ku-new smartd[832]: Device: /dev/twa0 [3ware_disk_00], SMART 
Usage Attribute: 7 Seek_Error_Rate changed from 200 to 100


но такие записи у меня каждый день, и во время проблем с контроллером
новых не появлялось. Посмотрел состояние дисков через smartctl -a, там
тоже всё чисто. На всякий случай запустил smartctl -t long, через пару
часов обещает закончить.

Гугль сообщает, что похожие ошибки наблюдались на старых драйверах
и прошивках, но были исправлены несколько лет назад. Драйвера в 8-ке
и так последние от производителя, прошивку в контроллере можно и обновить,
но саппорт LSI так и не ответил мне внятно, можно ли это делать на
работающем сервере (с последующей перезагрузкой), или обязательно
перепрошиваться из БИОС, а рисковать удалённым сервером в другой стране
как-то не очень хочется. :-(

Кстати, есть у кого-нибудь из присутствующих опыт перепрошивки 3ware
контроллеров через tw_cli?

--
WBR, Alexey Markov. 



Re: [freebsd] Ошибки на 3ware 9690SA-4I при обычном копировании

2014-02-05 Пенетрантность Alexander Chernyh




Кстати, есть у кого-нибудь из присутствующих опыт перепрошивки 3ware
контроллеров через tw_cli?


через tw_cli прошивается нормально
так прошивал 9650SE-2LP 9550SXU-4LP
не той прошивкой он не даст прошить




Re: [freebsd] Ошибки на 3ware 9690SA-4I при обычном копировании

2014-02-05 Пенетрантность Sergey Kobzar

Привет

On 02/05/14 13:13, Alexey Markov wrote:

Гугль сообщает, что похожие ошибки наблюдались на старых драйверах
и прошивках, но были исправлены несколько лет назад. Драйвера в 8-ке
и так последние от производителя, прошивку в контроллере можно и обновить,
но саппорт LSI так и не ответил мне внятно, можно ли это делать на
работающем сервере (с последующей перезагрузкой), или обязательно
перепрошиваться из БИОС, а рисковать удалённым сервером в другой стране
как-то не очень хочется. :-(

Кстати, есть у кого-нибудь из присутствующих опыт перепрошивки 3ware
контроллеров через tw_cli?


Контроллеры от 3ware довольно таки странные. 3-5 лет назад у меня было 
счастье в виде 10ка серверов с 3ware контроллерами как 8 так и 9й 
серии. OS - Linux + FreeBSD.


Так вот раз в месяц-два отваливался винт на каком-то из серверов. 
Сначала винты меняли. Потом обратились к 3ware - посоветовали накатить 
прошивку на контроллере и на винтах. Сделал. Помогло, но не очень - 
реже. Причем если воткнуть дохлый винт в десктоп - работает годами.


Закончился весь этот гемор сменой железа.


P.S. firmware обновлял с livecd, т.к. был доступ к IP-KVM и нужно было 
проапдетфить как контроллер, так и диски.


[freebsd] Re: [freebsd] Ошибки на 3ware 9690SA-4I при обычном копировании

2014-02-05 Пенетрантность Vasiliy P. Melnik
У меня была похожая беда - уже и не помню точно модель контроллера,
винты стояли сас. В общем все работало  без нареканий и черт меня
дернул обновить прошивку. А до этого стояла какая-то бета, и решил -
ну хуже ж не будет.

Прошивку я естественно не сохранил, а потом найти ее уже не смог, хотя
и долго искал. Сейчас контроллер валяется на полочке - постоянные
ребилды рейда вряд-ли способствуют сохранности информации.

В юниксах софтовые рейды уже давно работают как минимум - хорошо.


Re: [freebsd] ������ �� 3ware 9690SA-4I ��� ������� �����������

2014-02-05 Пенетрантность Alexey Markov

Hello, Alexander!
On February, 05 2014 at 15:26 you wrote to freebsd@uafug.org.ua:

?? Кстати, есть у кого-нибудь из присутствующих опыт перепрошивки 3ware
?? контроллеров через tw_cli?
AC через tw_cli прошивается нормально
AC так прошивал 9650SE-2LP 9550SXU-4LP
AC не той прошивкой он не даст прошить

После прошивки контроллера сервер сразу перезагружать
надо, или он некоторое время может поработать до плановой
перезагрузки?

А главное - при перепрошивке контроллера его настройки
сохраняются, или их надо заново настраивать, как после
прошивки БИОС-а на компе?

--
WBR, Alexey Markov. 



[freebsd] Re: [freebsd] Ошибки на 3ware 9690SA-4I при обычном копировании

2014-02-05 Пенетрантность Vasiliy P. Melnik
 После прошивки контроллера сервер сразу перезагружать
 надо, или он некоторое время может поработать до плановой
 перезагрузки?

по перезагрузки

 А главное - при перепрошивке контроллера его настройки
 сохраняются, или их надо заново настраивать, как после
 прошивки БИОС-а на компе?
ну у меня и разу не слетали. Если это успокоит :)


Re: [freebsd] FreeBSD-10+asterisk+chan_dongle issue

2014-02-05 Пенетрантность Nikita Olenets
Приветствую сообщество!

Для начала о плохом. (Всем кто давал свои рекомендации, ответ простой:
ничего не заработало, даже если модуль собрался, он не загружался в сам
астериск, ошибки все те же)
Стандартным момпилятором в 10-ке clang-ом, собрать это все не
представляется возможным.
А для того чтобы собрать работоспособный модуль под 10-ой, мне понадобилось:
pkg install gcc46

edit /etc/libmap.conf
libgcc_s.so.1   gcc46/libgcc_s.so.1
libgomp.so.1gcc46/libgomp.so.1
libobjc.so.3gcc46/libobjc.so.2
libssp.so.0 gcc46/libssp.so.0
libstdc++.so.6  gcc46/libstdc++.so.6

edit /etc/make.conf
.if !empty(.CURDIR:M/usr/ports/*)  exists(/usr/local/bin/gcc46)
CC=gcc46
CXX=g++46
CPP=cpp46
.endif

cd /usr/ports/net/asterisk11  make install clean (да-да, знаю что оно
притянет кучу пакетов и все они будут собраны gcc-ой)

После чего собираем сам модуль с одной лишь опцией конфигурации:
cd /tmp/asterisk-chan-dongle-asterisk11  ./configure CC=gcc46  make 
cp chan_dongle.so /usr/local/lib/asterisk/modules

Ну и как результат
test-10*CLI dongle show
device   devices  version
test-10*CLI dongle show version

chan_dongle: Huawei 3G Dongle Channel Driver, Version 1.1, Revision 16
Project Home: http://code.google.com/p/asterisk-chan-dongle
Bug Reporting: http://code.google.com/p/asterisk-chan-dongle/issues/list




2014-02-04 Volodymyr Kostyrko c.kw...@gmail.com:

 04.02.2014 15:38, Nikita Olenets написав(ла):

  Спасибо за советы, сейчас перепробую каждую из предложенных вариантов и
 отпишусь.


 Ну тогда ещё в копилку. Не факт что ему настолько нужен iconv и возможно
 его можно просто выключить:

 ./configure --without-libiconv

 Просто насколько я помню описание iconv на m4 немного с костылями и может
 давать сбои.


 --
 Sphinx of black quartz, judge my vow.




-- 
Head of network resource management group
Nikita Olenets
z...@zeon.kiev.ua
ZEON-UANIC
ZEON-RIPE


Re: [freebsd] ������ �� 3ware 9690SA-4I ��� ������� �����������

2014-02-05 Пенетрантность Alexey Markov

Hello, Anton!
On February, 05 2014 at 14:35 you wrote to freebsd@uafug.org.ua:

?? RAID: 3ware 9690SA-4I (512 Mb, BBU)
?? Диски: 2 x WDC WD5002ABYS
??
?? Сегодня в процессе подготовки к профилактике понадобилось скопировать
?? один из небольших разделов (80 Гб) в конец диска. Запустил dd, и почти
?? сразу сайт отвалился. В /var/log/messages в это время вижу:
?? twa0: Request 0 timed out!
?? twa0: INFO: (0x16: 0x1108): Resetting controller...:
?? twa0: INFO: (0x04: 0x005E): Cache synchronization completed: unit=0
?? twa0: INFO: (0x04: 0x0001): Controller reset occurred: resets=2

AY В первую очередь имеет смысл посмотреть SMART на дисках, если данные
AY 3ware позволяет это делать.
AY Потом запустить по очереди на кождом из дисков тест (smartctl -t long)
AY и еще раз посмотреть.

Прогнал длинные тесты на обоих винтах - ошибок нет. Похоже, дело не в них.

Посмотрел через gstat, iostat и top -m io, что больше всего винт грузит.
Оказалось, Постгрес постоянно что-то пишет на диск, причём с хорошей
скоростью - до 15-20 мегабайт в секунду. Скорее всего, это WAL-ы для
репликации со вторым сервером и сессии веб-движка. Подозреваю, что при
запуске dd винты просто захлёбываются, упираясь в потолок по IOPS.
Непонятно, правда, почему контроллер из-за этого дохнет. :-(

Кстати, а можно ли как-то ограничить число операций ввода/вывода для
процесса? Ну, типа nice, только не для ЦПУ, а для ввода/вывода. Или
хотя бы измерить их число за определённый промежуток времени?

--
WBR, Alexey Markov. 



Re: [freebsd] ������ �� 3ware 9690SA-4I ��� ������� �����������

2014-02-05 Пенетрантность Alexey Markov

Hello, Vasiliy!
On February, 05 2014 at 16:31 you wrote to Alexey Markov:

?? После прошивки контроллера сервер сразу перезагружать
?? надо, или он некоторое время может поработать до плановой
?? перезагрузки?
VPM по перезагрузки

Надеюсь, это означает может поработать ДО перезагрузки? ;-)

?? А главное - при перепрошивке контроллера его настройки
?? сохраняются, или их надо заново настраивать, как после
?? прошивки БИОС-а на компе?
VPM ну у меня и разу не слетали. Если это успокоит :)

Ох... У этого сервера вылезла ещё одна проблема, не получается
попасть в БИОС через удалённую IPMI-консоль. Так что в случае
неудачной прошивки контроллера я получу очень дорогой кирпич
в очень далёкой стране. :-/

--
WBR, Alexey Markov.