Re: [FUG-BR] Fatal trap 12: page fault while in kernel mode [SOLVED] (16 meses depois)

2014-02-03 Por tôpico Paulo Henrique - BSDs Brasil

Em 02/02/2014 21:04, Cleyton Agapito escreveu:
> Olá Caríssimos!
>
> É com muito prazer que compartilho com os senhores e senhoras um
> probleminha encardido que vinha me perturbando deste setembro de 2012,
> "Fatal trap 12: page
>   fault while in kernel mode", abaixo vou contar a historinha, no
> último parágrafo a solução.
>
> Eu poderia ficar o dia inteiro lendo notícias, programando que não
> dava nada, esporadicamente o sistema panicava, vendo vídeo, baixando
> torrents, copiando
> grandes arquivos (mesmo em modo solteiro [single]), nada coerente,
> consegui modelar a cabeça de um soldado imperial inteira no blender e
> de vez em quando ao
> renderizar panicava, não em todas. Compilar o kernel/userland também,
> de vez em quando ia tudo, de vez em quando parava (compilei a 8.2,
> 9.1, 9.2 e 10, cheguei à conclusão que
> não era a versão, hehe). Para ajudar tinham alguns reboots causados
> por inconsistências devido às constantes panes que só tornavam o
> problema mais nebuloso, ocorriam panes
> até em idle, sinistro. Os dumps vinham como se tivesse vazado bit pra
> todo lado,
> números absurdos nos mbufs, interfaces de rede e nos indicadores de paginação,
> esse até faz sentido já que a falha é de paginação, mas um não tinha
> nada a ver com outro,
> pareciam que vinham de máquinas diferentes.
>
> A Primeira suspeita é a memória, passei o memtest86+ diversas vezes e
> não apontava nada. Reinstalei todos os kernel drivers de diversas
> versões possíves e imagináveis
> (graças ao svn) e nada. As temperaturas dos processadores central,
> gráfico e da placa mãe
> normais, coloquei uma fonte nova de 400 velas e também não resolveu,
> desliguei journal,
> softupdates (esse doeu porque leva uma vida pra verificar um slice de
> 1G!). Suspeitei do disco SATA2 na interface SATA1 e de algum binário
> corrompído (tenho cerca de 2800 ports
> compilados e nem todos estão atualizados), então reinstalei o 10R em
> um disco IDE velho
> que tinha aqui e fui reconstruindo o sistema com binários, o
> windowmaker e o xosview nem
> abrem dão 11 direto (é só abrir, pelo menos sem pane), mas ao ver
> flash no firefox, pane,
> reiniciar, pane denovo, gqview, pane. Não era software.
>
> Aqui em Curitiba chegou o armagedom, e com isso as panes ficaram mais
> frequentes, mesmo com tudo limpinho e brilhante. Percebi que de vez em
> quando o X dava
>   sinal 6 e outras 10 (bus error!), descobri que quem throlla esse
> sinal é o processador,
> que andava a não mais que 60°C a todo o vapor. Suspeitei de algum
> problema na ponte
> norte, então baixei a velocidade do barramento frontal (FSB) para
> 100MHz (que era o
> mínimo que dava) e as panes pararam! Estressei ele bastante e não
> ocorreu nenhuma pane,
> até não foi difícil porque ele tava uma lesma mesmo e para ir a 2.5 de
> carga não precisava
> muito.
>
> No notebook do trampo o cooler estava entupido de poeira e até
> descobrir como desmontava aquela bomba (um HP6515b, no youtube tem a
> manha de um parafuseco escondido) eu baixava o clock pra não derreter
> tudo enquanto procurava no google, então o diagnóstico de temperatura
> (ainda mais em dias quentes) estava valendo, mas nenhum dos sensores
> apontava anormalidade em casa.
>
> Resolvi então desmontar o dissipador da ponte norte (PM4800CE) e tive
> a surpresa. Até tinha uma camada de pasta no dissipador mas só deixou
> marca nas bordas de plástico
> do chip, a moeda central (que é de metal) estava sem uma mancha de
> pasta! Nem sei
> como durou tanto tempo (ela já tem 7 anos). Melequei tudo de pasta, me
> empolguei e soquei na placa de video também (o que não foi uma boa
> ideia porque lá é aquela fita térmica que não sai, mas ficou toda
> lambuzada também). Ou seja, os sensores da placa
> mãe não pegam esse defeito, os programas de benchmark não conseguem 
> esquentá-lo
> o suficiente e os coredumps não dizem na da de relevante. É de perder
> os cabelos.
>
> Se algum gringo tiver tendo esse problema também e por infelicidade
> encontrar isso e não entender nada, vai aqui resumidamente em outras
> palavras:
>
> Overheating at the Northbridge, lack of thermal paste under the sink
> generating random
> page faults even under the normal conditions in the sensors and
> aproval of the smartd,
> memtest and bonnie. That is a tip.
>
> Abração à todos.
> -
> Histórico: http://www.fug.com.br/historico/html/freebsd/
> Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
É grande isso realmente incomoda muito, a HP saiu da minha lista de 
notebooks confiáveis depois da serie Pavillion DV6000 com pane no 
northbridge/GPU.

O lado bom é que está solucionado, valeu por ter compartilhado.

Att.

-- 
Paulo Henrique.
Grupo de Usuários do FreeBSD no Brasil.
Fone: (21) 96713-5042

-
Histórico: http://www.fug.com.br/historico/html/freebsd/
Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd


[FUG-BR] Fatal trap 12: page fault while in kernel mode [SOLVED] (16 meses depois)

2014-02-02 Por tôpico Cleyton Agapito
Olá Caríssimos!

É com muito prazer que compartilho com os senhores e senhoras um
probleminha encardido que vinha me perturbando deste setembro de 2012,
"Fatal trap 12: page
 fault while in kernel mode", abaixo vou contar a historinha, no
último parágrafo a solução.

Eu poderia ficar o dia inteiro lendo notícias, programando que não
dava nada, esporadicamente o sistema panicava, vendo vídeo, baixando
torrents, copiando
grandes arquivos (mesmo em modo solteiro [single]), nada coerente,
consegui modelar a cabeça de um soldado imperial inteira no blender e
de vez em quando ao
renderizar panicava, não em todas. Compilar o kernel/userland também,
de vez em quando ia tudo, de vez em quando parava (compilei a 8.2,
9.1, 9.2 e 10, cheguei à conclusão que
não era a versão, hehe). Para ajudar tinham alguns reboots causados
por inconsistências devido às constantes panes que só tornavam o
problema mais nebuloso, ocorriam panes
até em idle, sinistro. Os dumps vinham como se tivesse vazado bit pra
todo lado,
números absurdos nos mbufs, interfaces de rede e nos indicadores de paginação,
esse até faz sentido já que a falha é de paginação, mas um não tinha
nada a ver com outro,
pareciam que vinham de máquinas diferentes.

A Primeira suspeita é a memória, passei o memtest86+ diversas vezes e
não apontava nada. Reinstalei todos os kernel drivers de diversas
versões possíves e imagináveis
(graças ao svn) e nada. As temperaturas dos processadores central,
gráfico e da placa mãe
normais, coloquei uma fonte nova de 400 velas e também não resolveu,
desliguei journal,
softupdates (esse doeu porque leva uma vida pra verificar um slice de
1G!). Suspeitei do disco SATA2 na interface SATA1 e de algum binário
corrompído (tenho cerca de 2800 ports
compilados e nem todos estão atualizados), então reinstalei o 10R em
um disco IDE velho
que tinha aqui e fui reconstruindo o sistema com binários, o
windowmaker e o xosview nem
abrem dão 11 direto (é só abrir, pelo menos sem pane), mas ao ver
flash no firefox, pane,
reiniciar, pane denovo, gqview, pane. Não era software.

Aqui em Curitiba chegou o armagedom, e com isso as panes ficaram mais
frequentes, mesmo com tudo limpinho e brilhante. Percebi que de vez em
quando o X dava
 sinal 6 e outras 10 (bus error!), descobri que quem throlla esse
sinal é o processador,
que andava a não mais que 60°C a todo o vapor. Suspeitei de algum
problema na ponte
norte, então baixei a velocidade do barramento frontal (FSB) para
100MHz (que era o
mínimo que dava) e as panes pararam! Estressei ele bastante e não
ocorreu nenhuma pane,
até não foi difícil porque ele tava uma lesma mesmo e para ir a 2.5 de
carga não precisava
muito.

No notebook do trampo o cooler estava entupido de poeira e até
descobrir como desmontava aquela bomba (um HP6515b, no youtube tem a
manha de um parafuseco escondido) eu baixava o clock pra não derreter
tudo enquanto procurava no google, então o diagnóstico de temperatura
(ainda mais em dias quentes) estava valendo, mas nenhum dos sensores
apontava anormalidade em casa.

Resolvi então desmontar o dissipador da ponte norte (PM4800CE) e tive
a surpresa. Até tinha uma camada de pasta no dissipador mas só deixou
marca nas bordas de plástico
do chip, a moeda central (que é de metal) estava sem uma mancha de
pasta! Nem sei
como durou tanto tempo (ela já tem 7 anos). Melequei tudo de pasta, me
empolguei e soquei na placa de video também (o que não foi uma boa
ideia porque lá é aquela fita térmica que não sai, mas ficou toda
lambuzada também). Ou seja, os sensores da placa
mãe não pegam esse defeito, os programas de benchmark não conseguem esquentá-lo
o suficiente e os coredumps não dizem na da de relevante. É de perder
os cabelos.

Se algum gringo tiver tendo esse problema também e por infelicidade
encontrar isso e não entender nada, vai aqui resumidamente em outras
palavras:

Overheating at the Northbridge, lack of thermal paste under the sink
generating random
page faults even under the normal conditions in the sensors and
aproval of the smartd,
memtest and bonnie. That is a tip.

Abração à todos.
-
Histórico: http://www.fug.com.br/historico/html/freebsd/
Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd


Re: [FUG-BR] Fatal trap 12: page fault while in kernel mode

2006-11-29 Por tôpico Marcello Costa
Em Qua, 2006-11-29 às 12:25 -0300, audeni escreveu:
> - Original Message - 
> From: "Anderson Michel" <[EMAIL PROTECTED]>
> To: "Lista de discussao do grupo FUG-BR" 
> Sent: Wednesday, November 29, 2006 11:38 AM
> Subject: [FUG-BR] Fatal trap 12: page fault while in kernel mode
> 
> 
> Pessoal,
> 
> Estou tendo problemas com um Servidor de e-mail, que "tem vontade
> própria e reinicia sozinho, rsrs".
> 
> Analisando o /var/log/messages tenho algumas informações:
> 
> syslogd: kernel boot file is /boot/kernel/kernel
> kernel:
> kernel: Fatal trap 12: page fault while in kernel mode
> kernel: cpuid = 2; apic id = 06
> kernel: fault virtual address   = 0xac
> kernel: fault code  = supervisor write, page not present
> kernel: instruction pointer = 0x20:0xc05a4808
> kernel: stack pointer   = 0x28:0xe8698b18
> kernel: frame pointer   = 0x28:0xe8698b34
> kernel: code segment= base 0x0, limit 0xf, type 0x1b
> kernel: = DPL 0, pres 1, def32 1, gran 1
> kernel: processor eflags= interrupt enabled, resume, IOPL = 0
> kernel: current process = 33942 (tcpserver)
> kernel: trap number = 12
> kernel: panic: page fault
> kernel: cpuid = 2
> 
> No Google encontrei o seguinte:
> http://www.freebsd.org/doc/pt_BR.ISO8859-1/books/faq/advanced.html#KERNEL-PANIC-TROUBLESHOOTING
> 
> E executei o comando conforme descrito e obtive o seguinte resultado:
> 
> server# nm -n /boot/kernel/kernel | grep 0xc05a4808
> server# nm -n /boot/kernel/kernel | grep c05a4808
> server# nm -n /boot/kernel/kernel | grep c05a480
> server# nm -n /boot/kernel/kernel | grep c05a48
> server# nm -n /boot/kernel/kernel | grep c05a4
> c05a41ac T ip_fragment
> c05a44f8 T in_delayed_cksum
> c05a456c t ip_insertoptions
> c05a46b0 T ip_optcopy
> c05a4744 T ip_ctloutput
> c05a4f3c t ip_pcbopts
> server#
> 
> Essa máquina tem 2 processadores Xeon e 1GB RAM.
> Está instalado o FreeBSD 6.1-RELEASE.
> E rodando qmail+vpopmail+qmailscanner+spamassassin.
> 
> Estou desconfiado que seja a memória c/ problema, alguém tem alguma luz?
> Obs.: estou providênciando outra memória pra testes, ainda não chegou.
> 
> Tem algum outro procedimento a fazer??
> 
> Obrigado,
> 
> Anderson Michel
> -

Sim , use SEMPRE dois pentes de memorias se possivel ecc, se um der
problemas trabalha meia boca até vc arrumar outro pente de memória

-- 
Marcello Costa
BSD System Engineer
unixmafia at yahoo dot com dot br
FUG-BR #156 
http://www.fug.com.br






___ 
Voc� quer respostas para suas perguntas? Ou voc� sabe muito e quer compartilhar 
seu conhecimento? Experimente o Yahoo! Respostas !
http://br.answers.yahoo.com/
-
Histórico: http://www.fug.com.br/historico/html/freebsd/
Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd


Re: [FUG-BR] Fatal trap 12: page fault while in kernel mode

2006-11-29 Por tôpico audeni

- Original Message - 
From: "Anderson Michel" <[EMAIL PROTECTED]>
To: "Lista de discussao do grupo FUG-BR" 
Sent: Wednesday, November 29, 2006 11:38 AM
Subject: [FUG-BR] Fatal trap 12: page fault while in kernel mode


Pessoal,

Estou tendo problemas com um Servidor de e-mail, que "tem vontade
própria e reinicia sozinho, rsrs".

Analisando o /var/log/messages tenho algumas informações:

syslogd: kernel boot file is /boot/kernel/kernel
kernel:
kernel: Fatal trap 12: page fault while in kernel mode
kernel: cpuid = 2; apic id = 06
kernel: fault virtual address   = 0xac
kernel: fault code  = supervisor write, page not present
kernel: instruction pointer = 0x20:0xc05a4808
kernel: stack pointer   = 0x28:0xe8698b18
kernel: frame pointer   = 0x28:0xe8698b34
kernel: code segment= base 0x0, limit 0xf, type 0x1b
kernel: = DPL 0, pres 1, def32 1, gran 1
kernel: processor eflags= interrupt enabled, resume, IOPL = 0
kernel: current process = 33942 (tcpserver)
kernel: trap number = 12
kernel: panic: page fault
kernel: cpuid = 2

No Google encontrei o seguinte:
http://www.freebsd.org/doc/pt_BR.ISO8859-1/books/faq/advanced.html#KERNEL-PANIC-TROUBLESHOOTING

E executei o comando conforme descrito e obtive o seguinte resultado:

server# nm -n /boot/kernel/kernel | grep 0xc05a4808
server# nm -n /boot/kernel/kernel | grep c05a4808
server# nm -n /boot/kernel/kernel | grep c05a480
server# nm -n /boot/kernel/kernel | grep c05a48
server# nm -n /boot/kernel/kernel | grep c05a4
c05a41ac T ip_fragment
c05a44f8 T in_delayed_cksum
c05a456c t ip_insertoptions
c05a46b0 T ip_optcopy
c05a4744 T ip_ctloutput
c05a4f3c t ip_pcbopts
server#

Essa máquina tem 2 processadores Xeon e 1GB RAM.
Está instalado o FreeBSD 6.1-RELEASE.
E rodando qmail+vpopmail+qmailscanner+spamassassin.

Estou desconfiado que seja a memória c/ problema, alguém tem alguma luz?
Obs.: estou providênciando outra memória pra testes, ainda não chegou.

Tem algum outro procedimento a fazer??

Obrigado,

Anderson Michel
-
Histórico: http://www.fug.com.br/historico/html/freebsd/
Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd

-
Histórico: http://www.fug.com.br/historico/html/freebsd/
Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd


Re: [FUG-BR] Fatal trap 12: page fault while in kernel mode

2006-11-29 Por tôpico Giancarlo Rubio
page fault é problema de memória.
Tente limpar com borracha a memória, tirar a estática ou então troque-a


-- 
"Linux is for people who hate Windows,
BSD is for people who love UNIX"
Freebsd-BR User #88
---
Giancarlo Rubio

-
Histórico: http://www.fug.com.br/historico/html/freebsd/
Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd


[FUG-BR] Fatal trap 12: page fault while in kernel mode

2006-11-29 Por tôpico Anderson Michel
Pessoal,

Estou tendo problemas com um Servidor de e-mail, que "tem vontade 
própria e reinicia sozinho, rsrs".

Analisando o /var/log/messages tenho algumas informações:

syslogd: kernel boot file is /boot/kernel/kernel
kernel:
kernel: Fatal trap 12: page fault while in kernel mode
kernel: cpuid = 2; apic id = 06
kernel: fault virtual address   = 0xac
kernel: fault code  = supervisor write, page not present
kernel: instruction pointer = 0x20:0xc05a4808
kernel: stack pointer   = 0x28:0xe8698b18
kernel: frame pointer   = 0x28:0xe8698b34
kernel: code segment= base 0x0, limit 0xf, type 0x1b
kernel: = DPL 0, pres 1, def32 1, gran 1
kernel: processor eflags= interrupt enabled, resume, IOPL = 0
kernel: current process = 33942 (tcpserver)
kernel: trap number = 12
kernel: panic: page fault
kernel: cpuid = 2

No Google encontrei o seguinte:
http://www.freebsd.org/doc/pt_BR.ISO8859-1/books/faq/advanced.html#KERNEL-PANIC-TROUBLESHOOTING

E executei o comando conforme descrito e obtive o seguinte resultado:

server# nm -n /boot/kernel/kernel | grep 0xc05a4808
server# nm -n /boot/kernel/kernel | grep c05a4808
server# nm -n /boot/kernel/kernel | grep c05a480
server# nm -n /boot/kernel/kernel | grep c05a48
server# nm -n /boot/kernel/kernel | grep c05a4
c05a41ac T ip_fragment
c05a44f8 T in_delayed_cksum
c05a456c t ip_insertoptions
c05a46b0 T ip_optcopy
c05a4744 T ip_ctloutput
c05a4f3c t ip_pcbopts
server#

Essa máquina tem 2 processadores Xeon e 1GB RAM.
Está instalado o FreeBSD 6.1-RELEASE.
E rodando qmail+vpopmail+qmailscanner+spamassassin.

Estou desconfiado que seja a memória c/ problema, alguém tem alguma luz?
Obs.: estou providênciando outra memória pra testes, ainda não chegou.

Tem algum outro procedimento a fazer??

Obrigado,

Anderson Michel
-
Histórico: http://www.fug.com.br/historico/html/freebsd/
Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd