Re: [FUG-BR] Kernel panic STABLE 7.0

2009-03-20 Por tôpico gustavo
 Gustavo,
 Estou com um problema parecido com o seu. Arquivos grandes no backup congela
 a máquina.

 Mas estou usando o FreeBSD 7.1.

 Teve alguma novidade?

 []s,

 Ari

- Mensagem encaminhada de gust...@z -
 Data: Fri, 20 Mar 2009 12:46:43 -0300
 De: gust...@z
  Assunto: Re: [FUG-BR] Kernel panic STABLE 7.0
   Para: Ari

Confirme se as panic strings são iguais mesmo. No meu caso  
aparentemente foi um problema no sistema de arquivos devido aos caras  
do datacenter terem desligado a máquina na marra. Eu sugiro que vc  
cheque se for o mesmo panic string, quais as partições afetadas, passe  
fsck na mão e acima de tudo DESABILITE fsck em background pois ele só  
dá dor de cabeça, não parece funcionar... (vc pode fazer isso pelo  
rc.conf, background_fsck=NO )

estou na correria agora se me ocorrer alguma idéia entro em contato.

abraços
--gustavo

Citando Ari :




 2009/3/12 gust...@z

 Estou com um FreeBSD aqui num Dell Poweredge R200 que me deu uns
 kernel panics, eis as panic strings:

 Code:

 1)
   Dumptime: Thu Feb 26 09:02:42 2009
   Hostname: secrethostname
   Magic: FreeBSD Kernel Dump
   Version String: FreeBSD 7.0-RELEASE #0: Tue Nov  4 12:27:42 BRST 2008
 root@:/usr/src/sys/i386/compile/SECRETHOSTNAME
   Panic String: ffs_blkfree: freeing free block
 2)
   Dumptime: Fri Feb 27 11:30:59 2009
   Hostname: secrethostname
   Magic: FreeBSD Kernel Dump
   Panic String: ffs_clusteralloc: map mismatch
 3)
   Dumptime: Fri Feb 27 11:48:42 2009
   Hostname: secrethostname
   Magic: FreeBSD Kernel Dump
   Panic String: ffs_blkfree: freeing free block
 4)
   Dumptime: Tue Mar  3 10:30:28 2009
   Hostname: secrethostname
   Magic: FreeBSD Kernel Dump
   Panic String: ffs_blkfree: freeing free block
 5)
   Dumptime: Fri Mar  6 14:22:04 2009
   Hostname: secrethostname
   Magic: FreeBSD Kernel Dump
   Panic String: ufs_dirbad: /disk1: bad dir ino 1131015 at offset
 1536: mangled entry

 Tentei reproduzir o erro recriando a condição de arquivos grandes
 sendo movidos e/ou removidos dos sistemas de arquivos e não é sempre
 que acontece. No entanto 80% dos panics aconteceram durante a operação
 com arquivos grandes, sendo 3 na inserção de banco de dados e 1
 descompactando 2 GB (não muito grande o arquivo).

 Vi recomendações para se desabilitar soft-updates nos sistemas de
 arquivos mas ocorreu o panic mesmo assim, durante uma tentativa de
 inserção no banco PostgreSQL.

 Estou pesquisando problemas com drivers em relação a controladora
 SAS e estou desconfiado pela NIC estar compartilhando IRQ com a
 controladora.

 Só que agora eu estou realizando mais ou menos as mesmas atividades
 (diminuí bastante o tamanho do banco, e agora ele consegue inserir:
 antes acusava arquivo corrompido ou erro de sintaxe) e nada de panic.

 Daí pensei em rodar essa ferramenta do sysutils: stress. Mas
 aparentemente ela DÁ CRASH no sistema MESMO, pelo que li na
 documentação. Então não sei se vai ser útil pra testar o panic
 anterior ou se vou inventar um novo panic.


 Será que meus últimos fscks resolveram o FS e era isso que tava
 causando o panic? Será que ele vai voltar pra me assombrar? Como posso
 me certificar antes de botar a máquina em produção total?

 PS: uma das coisas que achei que poderia causar isso é bad RAM, pedi
 pra realizarem um memtest86+ faz 2 semanas e os caras meio que se
 recusam, não entendo pq, não entendo a dificuldade.

 abraços,
 --Gustavo

 Apêndices:

 # pciconf -vl

 hos...@pci0:0:0:0:  class=0x06 card=0x chip=0x29f08086
 rev=0x01 hdr=0x00
vendor = 'Intel Corporation'
device = '(Bearlake) Processor to I/O Controller'
class  = bridge
subclass   = HOST-PCI
 pc...@pci0:0:1:0:   class=0x060400 card=0x023c1028 chip=0x29f18086
 rev=0x01 hdr=0x01
vendor = 'Intel Corporation'
device = '(Bearlake) PCIe Root Port 1'
class  = bridge
subclass   = PCI-PCI
 pc...@pci0:0:28:0:  class=0x060400 card=0x023c1028 chip=0x29408086
 rev=0x02 hdr=0x01
vendor = 'Intel Corporation'
device = '82801IB/IR/IH (ICH9 Family) PCIe Root Port 1'
class  = bridge
subclass   = PCI-PCI
 pc...@pci0:0:28:4:  class=0x060400 card=0x023c1028 chip=0x29488086
 rev=0x02 hdr=0x01
vendor = 'Intel Corporation'
device = '82801IB/IR/IH (ICH9 Family) PCIe Root Port 5'
class  = bridge
subclass   = PCI-PCI
 pc...@pci0:0:28:5:  class=0x060400 card=0x023c1028 chip=0x294a8086
 rev=0x02 hdr=0x01
vendor = 'Intel Corporation'
device = '82801IB/IR/IH (ICH9 Family) PCIe Root Port 6'
class  = bridge
subclass   = PCI-PCI
 uh...@pci0:0:29:0:  class=0x0c0300 card=0x023c1028 chip=0x29348086
 rev=0x02 hdr=0x00
vendor = 'Intel Corporation'
device = '82801IB/IR/IH (ICH9 Family) USB Universal Host
 Controller'
class  = serial bus
subclass   = USB
 uh...@pci0:0:29:1:  class=0x0c0300 card=0x023c1028 chip=0x29358086
 rev=0x02 hdr=0x00

[FUG-BR] Kernel panic STABLE 7.0

2009-03-12 Por tôpico gustavo
Estou com um FreeBSD aqui num Dell Poweredge R200 que me deu uns  
kernel panics, eis as panic strings:

Code:

1)
Dumptime: Thu Feb 26 09:02:42 2009
Hostname: secrethostname
Magic: FreeBSD Kernel Dump
Version String: FreeBSD 7.0-RELEASE #0: Tue Nov  4 12:27:42 BRST 2008
  root@:/usr/src/sys/i386/compile/SECRETHOSTNAME
Panic String: ffs_blkfree: freeing free block
2)
Dumptime: Fri Feb 27 11:30:59 2009
Hostname: secrethostname
Magic: FreeBSD Kernel Dump
Panic String: ffs_clusteralloc: map mismatch
3)
Dumptime: Fri Feb 27 11:48:42 2009
Hostname: secrethostname
Magic: FreeBSD Kernel Dump
Panic String: ffs_blkfree: freeing free block
4)
Dumptime: Tue Mar  3 10:30:28 2009
Hostname: secrethostname
Magic: FreeBSD Kernel Dump
Panic String: ffs_blkfree: freeing free block
5)
Dumptime: Fri Mar  6 14:22:04 2009
Hostname: secrethostname
Magic: FreeBSD Kernel Dump
Panic String: ufs_dirbad: /disk1: bad dir ino 1131015 at offset
1536: mangled entry

Tentei reproduzir o erro recriando a condição de arquivos grandes
sendo movidos e/ou removidos dos sistemas de arquivos e não é sempre
que acontece. No entanto 80% dos panics aconteceram durante a operação
com arquivos grandes, sendo 3 na inserção de banco de dados e 1
descompactando 2 GB (não muito grande o arquivo).

Vi recomendações para se desabilitar soft-updates nos sistemas de
arquivos mas ocorreu o panic mesmo assim, durante uma tentativa de
inserção no banco PostgreSQL.

Estou pesquisando problemas com drivers em relação a controladora
SAS e estou desconfiado pela NIC estar compartilhando IRQ com a
controladora.

Só que agora eu estou realizando mais ou menos as mesmas atividades  
(diminuí bastante o tamanho do banco, e agora ele consegue inserir:  
antes acusava arquivo corrompido ou erro de sintaxe) e nada de panic.

Daí pensei em rodar essa ferramenta do sysutils: stress. Mas  
aparentemente ela DÁ CRASH no sistema MESMO, pelo que li na  
documentação. Então não sei se vai ser útil pra testar o panic  
anterior ou se vou inventar um novo panic.


Será que meus últimos fscks resolveram o FS e era isso que tava  
causando o panic? Será que ele vai voltar pra me assombrar? Como posso  
me certificar antes de botar a máquina em produção total?

PS: uma das coisas que achei que poderia causar isso é bad RAM, pedi  
pra realizarem um memtest86+ faz 2 semanas e os caras meio que se  
recusam, não entendo pq, não entendo a dificuldade.

abraços,
--Gustavo

Apêndices:

# pciconf -vl

hos...@pci0:0:0:0:  class=0x06 card=0x chip=0x29f08086  
rev=0x01 hdr=0x00
 vendor = 'Intel Corporation'
 device = '(Bearlake) Processor to I/O Controller'
 class  = bridge
 subclass   = HOST-PCI
pc...@pci0:0:1:0:   class=0x060400 card=0x023c1028 chip=0x29f18086  
rev=0x01 hdr=0x01
 vendor = 'Intel Corporation'
 device = '(Bearlake) PCIe Root Port 1'
 class  = bridge
 subclass   = PCI-PCI
pc...@pci0:0:28:0:  class=0x060400 card=0x023c1028 chip=0x29408086  
rev=0x02 hdr=0x01
 vendor = 'Intel Corporation'
 device = '82801IB/IR/IH (ICH9 Family) PCIe Root Port 1'
 class  = bridge
 subclass   = PCI-PCI
pc...@pci0:0:28:4:  class=0x060400 card=0x023c1028 chip=0x29488086  
rev=0x02 hdr=0x01
 vendor = 'Intel Corporation'
 device = '82801IB/IR/IH (ICH9 Family) PCIe Root Port 5'
 class  = bridge
 subclass   = PCI-PCI
pc...@pci0:0:28:5:  class=0x060400 card=0x023c1028 chip=0x294a8086  
rev=0x02 hdr=0x01
 vendor = 'Intel Corporation'
 device = '82801IB/IR/IH (ICH9 Family) PCIe Root Port 6'
 class  = bridge
 subclass   = PCI-PCI
uh...@pci0:0:29:0:  class=0x0c0300 card=0x023c1028 chip=0x29348086  
rev=0x02 hdr=0x00
 vendor = 'Intel Corporation'
 device = '82801IB/IR/IH (ICH9 Family) USB Universal Host Controller'
 class  = serial bus
 subclass   = USB
uh...@pci0:0:29:1:  class=0x0c0300 card=0x023c1028 chip=0x29358086  
rev=0x02 hdr=0x00
 vendor = 'Intel Corporation'
 device = '82801IB/IR/IH (ICH9 Family) USB Universal Host Controller'
 class  = serial bus
 subclass   = USB
uh...@pci0:0:29:2:  class=0x0c0300 card=0x023c1028 chip=0x29368086  
rev=0x02 hdr=0x00
 vendor = 'Intel Corporation'
 device = '82801IB/IR/IH (ICH9 Family) USB Universal Host Controller'
 class  = serial bus
 subclass   = USB
eh...@pci0:0:29:7:  class=0x0c0320 card=0x023c1028 chip=0x293a8086  
rev=0x02 hdr=0x00
 vendor = 'Intel Corporation'
 device = '82801IB/IR/IH (ICH9 Family) USB2 Enhanced Host Controller'
 class  = serial bus
 subclass   = USB
pc...@pci0:0:30:0:  class=0x060401 card=0x chip=0x244e8086  
rev=0x92 hdr=0x01
 vendor = 'Intel Corporation'
 device = '82801 Family (ICH2/3/4/4/5/5/6/7/8/9,63xxESB) Hub  
Interface to