Re: [Sysadmins] Рассыпался LVM
Отправитель: Michael Shigorin
Получатель: "ALT Linux sysadmins' discussion"
On Wed, Jun 08, 2011 at 02:09:08PM +0400, Yuri Khachaturyan wrote:
> После какого-то непонятного сбоя (система ругалась на EXT4
> filesystem IO error)
В dmes
Бэкапы успешно делаются заново, это не проблема.
Проблема в том, как сделать так, чтобы оно заново не умерло еще через
месяц и понять причину этого глюка.
8 июня 2011 г. 15:14 пользователь Michael Shigorin написал:
> On Wed, Jun 08, 2011 at 02:59:05PM +0400, Yuri Khachaturyan wrote:
>> Jun 5 04:
On Wed, Jun 08, 2011 at 02:59:05PM +0400, Yuri Khachaturyan wrote:
> Jun 5 04:15:54 bacula kernel: [135757.152370] end_request: I/O
> error, dev sdg, sector 2111265344
[...]
> Jun 7 18:57:02 bacula kernel: [361424.269659] sd 7:0:2:0:
> rejecting I/O to offline device
[...]
> После чего система вс
RAID контроллер аппаратный ? Он сам то RAID видит, и что в его логах ?
RAID какой был ?
08.06.2011 14:59, Yuri Khachaturyan пишет:
Очень похоже что именно в контроллере, только понять бы в каком - в
SCSI карте или контроллере самого массива.
Вот что произошло изначально:
bash-3.2# grep kernel
Очень похоже что именно в контроллере, только понять бы в каком - в
SCSI карте или контроллере самого массива.
Вот что произошло изначально:
bash-3.2# grep kernel /var/log/messages |less
Jun 5 04:12:54 bacula kernel: [135577.144376] Buffer I/O error on
device dm-0, logical block 0
Jun 5 04:12:
On Wed, Jun 08, 2011 at 02:44:52PM +0400, Yuri Khachaturyan wrote:
> Но lvm все равно рассыпался после того, как он хотя-бы
> SCSI-биосом стал определяться... Вот теперь думаю как вытащить
> оттуда данные...
Из hwraid+lvm не приходилось, но общая рекомендация --
постараться сделать копии дисков пе
Подозреваю, что никак.
По хорошему не надо было трогать lv и смотреть что на физических дисках.
Теперь там явно какая-то хрень.
Но я подозреваю что дело даже не в этом, а в RAID контроллере, скорее
всего он тебе данные попортил.
08.06.2011 14:44, Yuri Khachaturyan пишет:
Наблюдалось - пере
Наблюдалось - переклинило контроллер на самом аппаратном массиве.
Вылечилось перезагрузкой.
Но lvm все равно рассыпался после того, как он хотя-бы SCSI-биосом
стал определяться... Вот теперь думаю как вытащить оттуда данные...
8 июня 2011 г. 14:43 пользователь Michael Shigorin написал:
> On Wed,
On Wed, Jun 08, 2011 at 02:09:08PM +0400, Yuri Khachaturyan wrote:
> После какого-то непонятного сбоя (система ругалась на EXT4
> filesystem IO error)
В dmesg случайно ничего про железо не наблюдалось?
(я тут хорошо побился головой об стенку за ту неделю,
сочтя программные грабли за аппаратные --
Добрый день!
Есть аппаратный массив, на котором собраны 3 RAID-5.
В системе они были объединены в LVM2 в единый раздел EXT4.
После какого-то непонятного сбоя (система ругалась на EXT4 filesystem
IO error) после ряда перезагрузок и обновления ядра до
2.6.39-un-def-alt1 (только с ним SCSI контролле
10 matches
Mail list logo