Re: [FUG-BR] [off-topic] segunda tentativa de migração manicomio-share para FreeBSD [RESOLVIDO]

2013-01-13 Por tôpico Antônio Pessoa
2013/1/13 Marcelo Gondim gon...@bsdinfo.com.br

 Pessoal,

 Acho que descobri algo que pode estar causando todo o problema. Após
 colocar o KVM-IP e agora também tenho percebido melhor nos logs o seguinte:

 MCA: Bank 8, Status 0xcc194901009f
 MCA: Global Cap 0x1c09, Status 0x
 MCA: Vendor GenuineIntel, ID 0x206c2, APIC ID 0
 MCA: CPU 0 COR (25892) OVER RD channel ?? memory error
 MCA: Address 0x5480c7b40
 MCA: Misc 0x4670220100010386

 Essa mensagem vira e mexe dá e quando o mysql dispara na cpu elas
 aparecem. Pelo que estou percebendo isso pode ser problema com algum
 banco de memória do servidor. Estou correto?
 Até os filhos do apache estão sendo assassinados com essas mensagens:

 [Wed Jan 09 23:49:40 2013] [notice] child pid 54806 exit signal Illegal
 instruction (4)
 [Wed Jan 09 23:49:40 2013] [notice] child pid 54308 exit signal Illegal
 instruction (4)
 [Wed Jan 09 23:49:40 2013] [notice] child pid 53252 exit signal Illegal
 instruction (4)
 [Wed Jan 09 23:49:40 2013] [notice] child pid 53120 exit signal Illegal
 instruction (4)

 E tipo já corrompeu uma base mysql uma vez e uma partição me obrigando à
 entrar em fsck manual. Também aconteceu de no meio do boot rebootar e
 umas duas vezes travar na ACPI e ficar quase 1 hora pra sair.

 Pedi para checarem a memória do servidor. Vamos ver, depois dessa ainda
 existe luz no fim do túnel. rsrsrsrs



Você tem condições de executar o memtest completo nesse servidor?
Seria interessante, mesmo com o resultado do suporte do data center.

--
Atenciosamente,

Antônio Pessoa
-
Histórico: http://www.fug.com.br/historico/html/freebsd/
Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd


Re: [FUG-BR] [off-topic] segunda tentativa de migração manicomio-share para FreeBSD [RESOLVIDO]

2013-01-13 Por tôpico Marcelo Gondim
Em 13/01/13 22:59, Antônio Pessoa escreveu:
 2013/1/13 Marcelo Gondim gon...@bsdinfo.com.br
 Pessoal,

 Acho que descobri algo que pode estar causando todo o problema. Após
 colocar o KVM-IP e agora também tenho percebido melhor nos logs o seguinte:

 MCA: Bank 8, Status 0xcc194901009f
 MCA: Global Cap 0x1c09, Status 0x
 MCA: Vendor GenuineIntel, ID 0x206c2, APIC ID 0
 MCA: CPU 0 COR (25892) OVER RD channel ?? memory error
 MCA: Address 0x5480c7b40
 MCA: Misc 0x4670220100010386

 Essa mensagem vira e mexe dá e quando o mysql dispara na cpu elas
 aparecem. Pelo que estou percebendo isso pode ser problema com algum
 banco de memória do servidor. Estou correto?
 Até os filhos do apache estão sendo assassinados com essas mensagens:

 [Wed Jan 09 23:49:40 2013] [notice] child pid 54806 exit signal Illegal
 instruction (4)
 [Wed Jan 09 23:49:40 2013] [notice] child pid 54308 exit signal Illegal
 instruction (4)
 [Wed Jan 09 23:49:40 2013] [notice] child pid 53252 exit signal Illegal
 instruction (4)
 [Wed Jan 09 23:49:40 2013] [notice] child pid 53120 exit signal Illegal
 instruction (4)

 E tipo já corrompeu uma base mysql uma vez e uma partição me obrigando à
 entrar em fsck manual. Também aconteceu de no meio do boot rebootar e
 umas duas vezes travar na ACPI e ficar quase 1 hora pra sair.

 Pedi para checarem a memória do servidor. Vamos ver, depois dessa ainda
 existe luz no fim do túnel. rsrsrsrs


 Você tem condições de executar o memtest completo nesse servidor?
 Seria interessante, mesmo com o resultado do suporte do data center.
Ummm vou tentar. O problema também é que o suporte do datacenter não é 
tão bom, eles demoram muito e eles estão 7 horas na nossa frente.
Ainda bem que não é comum ter essas paradas, só fiz dessa vez para 
tentar migrar para o FreeBSD e acho que acabei descobrindo um problema 
no Hardware.
Também fiz umas mexidas de tunning. Abaixo como estão:

sysctl.conf:
=
kern.ipc.somaxconn=4096
kern.ipc.shmall=262144
net.inet.ip.redirect=0
net.inet.ip.sourceroute=0
net.inet.ip.accept_sourceroute=0
net.inet.icmp.maskrepl=0
net.inet.icmp.log_redirect=0
net.inet.icmp.drop_redirect=1
net.inet.tcp.drop_synfin=1
net.inet.udp.blackhole=1
net.inet.tcp.blackhole=2
net.inet6.icmp6.nodeinfo=0
net.inet6.ip6.use_tempaddr=1
net.inet6.ip6.prefer_tempaddr=1
net.inet6.icmp6.rediraccept=0
net.inet.ip.fw.dyn_max=65536
net.inet.icmp.icmplim=500

loader.conf:
==
loader_logo=beastie
kern.maxusers=1024
kern.ipc.nmbclusters=32768
kern.ipc.semmnu=256
kern.ipc.semmns=1024
kern.ipc.semmni=520
kern.ipc.semume=100
kern.ipc.shmmni=256
kern.ipc.msgseg=32767
kern.ipc.msgssz=32
kern.ipc.msgmnb=65535
kern.ipc.msgtql=2046

netstat -m:
=
8659/13361/22020 mbufs in use (current/cache/total)
8551/4127/12678/32768 mbuf clusters in use (current/cache/total/max)
8551/4121 mbuf+clusters out of packet secondary zone in use (current/cache)
89/905/994/16384 4k (page size) jumbo clusters in use 
(current/cache/total/max)
0/0/0/8192 9k jumbo clusters in use (current/cache/total/max)
0/0/0/4096 16k jumbo clusters in use (current/cache/total/max)
19622K/15214K/34837K bytes allocated to network (current/cache/total)
0/0/0 requests for mbufs denied (mbufs/clusters/mbuf+clusters)
0/0/0 requests for jumbo clusters denied (4k/9k/16k)
0/0/0 sfbufs in use (current/peak/max)
0 requests for sfbufs denied
0 requests for sfbufs delayed
681 requests for I/O initiated by sendfile
0 calls to protocol drain routines

ipcs -a:
==
Message Queues:
T   ID  KEY MODEOWNERGROUPCREATOR 
CGROUP CBYTES QNUM QBYTES
LSPIDLRPID STIMERTIMECTIME

Shared Memory:
T   ID  KEY MODEOWNERGROUPCREATOR 
CGROUP NATTCHSEGSZ CPID LPID ATIME
DTIMECTIME

Semaphores:
T   ID  KEY MODEOWNERGROUPCREATOR 
CGROUP  NSEMS OTIMECTIME

gstat:
=
dT: 1.002s  w: 1.000s
  L(q)  ops/sr/s   kBps   ms/rw/s   kBps   ms/w   %busy Name
 0  2  0  00.0  2 640.40.1| mfid0
 0  0  0  00.0  0  00.00.0| mfid0p1
 0  0  0  00.0  0  00.00.0| mfid0p2
 0  0  0  00.0  0  00.00.0| mfid0p3
 0  0  0  00.0  0  00.00.0| mfid0p4
 0  2  0  00.0  2 640.40.1| mfid0p5
 0  0  0  00.0  0  00.00.0| mfid0p6
 0  0  0  00.0  0  00.00.0| mfid0p7
 0  0  0  00.0  0  00.00.0| mfid0p8
 0  0  0  00.0  0  00.00.0| 
gptid/f315c6e7-5a5d-11e2-97d0-001e67036860
 0  0  0  00.0  0  00.00.0| label/rootfs
 0  0  0  00.0  0  00.00.0| label/swap