[FreeBSD-users-jp 96076] Re: ディスククラッシュの時

2017-04-07 スレッド表示 小野寛生
小野寛生です。

2017年4月7日 23:58 ke...@kens.fm :
> 疑問ですがFreeBSD のインストーラで普通に
> ZFSを選択してインストールする場合
> swapはZFS上に作成されませんが
> ZFS上にSWAPを置くと他の面で何か
> デメリットがあってインストーラでは
> 採用されていないのでしょうか?

kernel の crash dump が保存できないんじゃなかったかと思いますが、違いましたっけ。
聞くたびに忘れてしまうのですが、あんまし薦められないと聞いた気はします。

問題が crash dump だけなら、geom_mirror が使えますというか、私はこっちを使っています。
gmirror(8) のマニュアルの NOTE のところあたりを参考にしました。
___
freebsd-users-jp@freebsd.org mailing list
https://lists.freebsd.org/mailman/listinfo/freebsd-users-jp
To unsubscribe, send any mail to "freebsd-users-jp-unsubscr...@freebsd.org"


[FreeBSD-users-jp 96074] Re: ディスククラッシュの時

2017-04-07 スレッド表示 小野寛生
小野寛生です。

2017年4月7日 18:48 ke...@kens.fm :
> けんずふぁみりーです
>
> 2台のハードディスクを ZFS mirror-0 として使っていました。
> そのうち1台のハードディスクが壊れた時にリモートからもキーボードをつない
> でも操作できなくなり強制的に電源を切って再起動する事になりました。
> 再起動後は残り1台のハードディスクで起動できましたがディスクが壊れた時点
> から再起動するまで全てのサービスが異常な状態が続きました。
> 折角2台のディスクでミラーしているので1台が壊れた場合にそちらは切り離され
> て正常な1台でそのまま稼働できるようにはならないものかと思います。
> エラーメッセージにswapの記述が多いのでswapの設定でどうにかなりますか?
>
>
> 正常時の構成
>
> # gpart show
> =>40  5860533088  ada0  GPT  (2.7T)
>   401600 1  efi  (800K)
> 1640 408- free -  (204K)
> 2048 4194304 2  freebsd-swap  (2.0G)
>  4196352  5856335872 3  freebsd-zfs  (2.7T)
>   5860532224 904- free -  (452K)
>
> =>40  5860533088  ada1  GPT  (2.7T)
>   401600 1  efi  (800K)
> 1640 408- free -  (204K)
> 2048 4194304 2  freebsd-swap  (2.0G)
>  4196352  5856335872 3  freebsd-zfs  (2.7T)
>   5860532224 904- free -  (452K)
>
> # zpool status
>   pool: zroot
>  state: ONLINE
>   scan: none requested
> config:
>
> NAMESTATE READ WRITE CKSUM
> zroot   ONLINE   0 0 0
>   mirror-0  ONLINE   0 0 0
> ada0p3  ONLINE   0 0 0
> ada1p3  ONLINE   0 0 0
>
> errors: No known data errors
>
> # swapinfo
> Device  1K-blocks UsedAvail Capacity
> /dev/ada0p2   20971520  2097152 0%
> /dev/ada1p2   20971520  2097152 0%
> Total 41943040  4194304 0%

この構成を見ると、クラッシュした ada1 の p2 がまだ swap に指定されていて、swap 時に盛大にエラーが出ているのではないかと思います。
/etc/fstab の swap の指定のうち、ada1p2 の項をコメントアウトして再起動したら、とりあえずは問題なく起動できないでしょうか。

それでもだめなら、ada0 の方もやられているという可能性があると思います。


> クラッシュ時の/var/log/messages
>
> Mar 20 08:21:35 maria kernel: Limiting open port RST response from 233 to 200 
> packets/sec
> Apr  3 07:04:10 maria kernel: Limiting open port RST response from 310 to 200 
> packets/sec
> Apr  5 21:33:04 maria kernel: ada1 at ahcich3 bus 0 scbus3 target 0 lun 0
> Apr  5 21:33:04 maria kernel: ada1:  s/n 
> JPB440HA2J1DHB detached
> Apr  5 21:33:04 maria kernel: (ada1:ahcich3:0:0:0): Periph destroyed
> Apr  5 21:33:04 maria kernel: swap_pager: I/O error - pagein failed; blkno 
> 591213,size 4096, error 6
> Apr  5 21:33:04 maria kernel: vm_fault: pager read error, pid 364 (devd)
> Apr  5 21:33:04 maria kernel: swap_pager: I/O error - pagein failed; blkno 
> 524449,size 4096, error 6
> Apr  5 21:33:04 maria kernel: vm_fault: pager read error, pid 364 (devd)
> Apr  5 21:33:04 maria kernel: Failed to write core file for process devd 
> (error 14)
> Apr  5 21:33:04 maria kernel: pid 364 (devd), uid 0: exited on signal 11
> Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): ATA_IDENTIFY. ACB: ec 
> 00 00 00 00 40 00 00 00 00 00 00
> Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): CAM status: ATA Status 
> Error
> Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): ATA status: 51 (DRDY 
> SERV ERR), error: 04 (ABRT )
> Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): RES: 51 04 00 00 00 40 
> 00 00 00 00 01
> Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): Retrying command
> Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): ATA_IDENTIFY. ACB: ec 
> 00 00 00 00 40 00 00 00 00 00 00
> Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): CAM status: ATA Status 
> Error
> Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): ATA status: 51 (DRDY 
> SERV ERR), error: 04 (ABRT )
> Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): RES: 51 04 00 00 00 40 
> 00 00 00 00 01
> Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): Error 5, Retries 
> exhausted
> Apr  5 21:40:00 maria kernel: swap_pager: I/O error - pagein failed; blkno 
> 593387,size 4096, error 6
> Apr  5 21:40:00 maria kernel: vm_fault: pager read error, pid 939 (mysqld)
> Apr  5 21:40:00 maria kernel: swap_pager: I/O error - pagein failed; blkno 
> 593387,size 4096, error 6
> Apr  5 21:40:00 maria kernel: vm_fault: pager read error, pid 939 (mysqld)
> Apr  5 21:40:00 maria kernel: swap_pager: I/O error - pagein failed; blkno 
> 589546,size 4096, error 6
> Apr  5 21:40:00 maria kernel: vm_fault: pager read error, pid 939 (mysqld)
> Apr  5 21:40:00 maria kernel: swap_pager: I/O error - pagein failed; blkno 
> 589546,size 4096, error 6
> Apr  5 21:40:00 maria kernel: vm_fault: pager read error, pid 939 (mysqld)
> Apr  5 21:40:01 maria kernel: swap_pager: I/O error - pagein failed; blkno 
> 524414,size 4096, error 6
> Apr  5 21:40:01 maria kernel: vm_fault: pager read error, pid 939 (mysqld)
> Apr  5 21:40:01 maria kernel: Failed to write core file for process mysqld 
> (error 14)
> Apr  5 21:40:01 maria kernel: pid 939 (mysqld), uid 88: exited on signal 4
> Apr  5 21:40:02 maria kernel: swap_pager: I/O error - pagein failed; blkno 
> 550128,size 12288, error 6
> Apr  5 21:40:02 maria kernel: vm_fault: pager read error, 

[FreeBSD-users-jp 96073] ディスククラッシュの時

2017-04-07 スレッド表示 ke...@kens.fm
けんずふぁみりーです

2台のハードディスクを ZFS mirror-0 として使っていました。
そのうち1台のハードディスクが壊れた時にリモートからもキーボードをつない
でも操作できなくなり強制的に電源を切って再起動する事になりました。
再起動後は残り1台のハードディスクで起動できましたがディスクが壊れた時点
から再起動するまで全てのサービスが異常な状態が続きました。
折角2台のディスクでミラーしているので1台が壊れた場合にそちらは切り離され
て正常な1台でそのまま稼働できるようにはならないものかと思います。
エラーメッセージにswapの記述が多いのでswapの設定でどうにかなりますか?


正常時の構成

# gpart show
=>40  5860533088  ada0  GPT  (2.7T)
  401600 1  efi  (800K)
1640 408- free -  (204K)
2048 4194304 2  freebsd-swap  (2.0G)
 4196352  5856335872 3  freebsd-zfs  (2.7T)
  5860532224 904- free -  (452K)

=>40  5860533088  ada1  GPT  (2.7T)
  401600 1  efi  (800K)
1640 408- free -  (204K)
2048 4194304 2  freebsd-swap  (2.0G)
 4196352  5856335872 3  freebsd-zfs  (2.7T)
  5860532224 904- free -  (452K)

# zpool status
  pool: zroot
 state: ONLINE
  scan: none requested
config:

NAMESTATE READ WRITE CKSUM
zroot   ONLINE   0 0 0
  mirror-0  ONLINE   0 0 0
ada0p3  ONLINE   0 0 0
ada1p3  ONLINE   0 0 0

errors: No known data errors

# swapinfo
Device  1K-blocks UsedAvail Capacity
/dev/ada0p2   20971520  2097152 0%
/dev/ada1p2   20971520  2097152 0%
Total 41943040  4194304 0%

クラッシュ時の/var/log/messages

Mar 20 08:21:35 maria kernel: Limiting open port RST response from 233 to 200 
packets/sec
Apr  3 07:04:10 maria kernel: Limiting open port RST response from 310 to 200 
packets/sec
Apr  5 21:33:04 maria kernel: ada1 at ahcich3 bus 0 scbus3 target 0 lun 0
Apr  5 21:33:04 maria kernel: ada1:  s/n 
JPB440HA2J1DHB detached
Apr  5 21:33:04 maria kernel: (ada1:ahcich3:0:0:0): Periph destroyed
Apr  5 21:33:04 maria kernel: swap_pager: I/O error - pagein failed; blkno 
591213,size 4096, error 6
Apr  5 21:33:04 maria kernel: vm_fault: pager read error, pid 364 (devd)
Apr  5 21:33:04 maria kernel: swap_pager: I/O error - pagein failed; blkno 
524449,size 4096, error 6
Apr  5 21:33:04 maria kernel: vm_fault: pager read error, pid 364 (devd)
Apr  5 21:33:04 maria kernel: Failed to write core file for process devd (error 
14)
Apr  5 21:33:04 maria kernel: pid 364 (devd), uid 0: exited on signal 11
Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): ATA_IDENTIFY. ACB: ec 00 
00 00 00 40 00 00 00 00 00 00
Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): CAM status: ATA Status 
Error
Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): ATA status: 51 (DRDY 
SERV ERR), error: 04 (ABRT )
Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): RES: 51 04 00 00 00 40 
00 00 00 00 01
Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): Retrying command
Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): ATA_IDENTIFY. ACB: ec 00 
00 00 00 40 00 00 00 00 00 00
Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): CAM status: ATA Status 
Error
Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): ATA status: 51 (DRDY 
SERV ERR), error: 04 (ABRT )
Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): RES: 51 04 00 00 00 40 
00 00 00 00 01
Apr  5 21:33:06 maria kernel: (aprobe0:ahcich3:0:0:0): Error 5, Retries 
exhausted
Apr  5 21:40:00 maria kernel: swap_pager: I/O error - pagein failed; blkno 
593387,size 4096, error 6
Apr  5 21:40:00 maria kernel: vm_fault: pager read error, pid 939 (mysqld)
Apr  5 21:40:00 maria kernel: swap_pager: I/O error - pagein failed; blkno 
593387,size 4096, error 6
Apr  5 21:40:00 maria kernel: vm_fault: pager read error, pid 939 (mysqld)
Apr  5 21:40:00 maria kernel: swap_pager: I/O error - pagein failed; blkno 
589546,size 4096, error 6
Apr  5 21:40:00 maria kernel: vm_fault: pager read error, pid 939 (mysqld)
Apr  5 21:40:00 maria kernel: swap_pager: I/O error - pagein failed; blkno 
589546,size 4096, error 6
Apr  5 21:40:00 maria kernel: vm_fault: pager read error, pid 939 (mysqld)
Apr  5 21:40:01 maria kernel: swap_pager: I/O error - pagein failed; blkno 
524414,size 4096, error 6
Apr  5 21:40:01 maria kernel: vm_fault: pager read error, pid 939 (mysqld)
Apr  5 21:40:01 maria kernel: Failed to write core file for process mysqld 
(error 14)
Apr  5 21:40:01 maria kernel: pid 939 (mysqld), uid 88: exited on signal 4
Apr  5 21:40:02 maria kernel: swap_pager: I/O error - pagein failed; blkno 
550128,size 12288, error 6
Apr  5 21:40:02 maria kernel: vm_fault: pager read error, pid 783 (sh)
Apr  5 21:40:02 maria kernel: swap_pager: I/O error - pagein failed; blkno 
550128,size 12288, error 6
Apr  5 21:40:02 maria kernel: vm_fault: pager read error, pid 783 (sh)
Apr  5 21:40:02 maria kernel: pid 783 (sh), uid 88: exited on signal 11
この後延々と続く
___
freebsd-users-jp@freebsd.org mailing list
https://lists.freebsd.org/mailman/listinfo/freebsd-users-jp
To unsubscribe, send any mail to