Re: [FUG-BR] Fatal trap 12: page fault while in kernel mode [SOLVED] (16 meses depois)
Em 02/02/2014 21:04, Cleyton Agapito escreveu: > Olá Caríssimos! > > É com muito prazer que compartilho com os senhores e senhoras um > probleminha encardido que vinha me perturbando deste setembro de 2012, > "Fatal trap 12: page > fault while in kernel mode", abaixo vou contar a historinha, no > último parágrafo a solução. > > Eu poderia ficar o dia inteiro lendo notícias, programando que não > dava nada, esporadicamente o sistema panicava, vendo vídeo, baixando > torrents, copiando > grandes arquivos (mesmo em modo solteiro [single]), nada coerente, > consegui modelar a cabeça de um soldado imperial inteira no blender e > de vez em quando ao > renderizar panicava, não em todas. Compilar o kernel/userland também, > de vez em quando ia tudo, de vez em quando parava (compilei a 8.2, > 9.1, 9.2 e 10, cheguei à conclusão que > não era a versão, hehe). Para ajudar tinham alguns reboots causados > por inconsistências devido às constantes panes que só tornavam o > problema mais nebuloso, ocorriam panes > até em idle, sinistro. Os dumps vinham como se tivesse vazado bit pra > todo lado, > números absurdos nos mbufs, interfaces de rede e nos indicadores de paginação, > esse até faz sentido já que a falha é de paginação, mas um não tinha > nada a ver com outro, > pareciam que vinham de máquinas diferentes. > > A Primeira suspeita é a memória, passei o memtest86+ diversas vezes e > não apontava nada. Reinstalei todos os kernel drivers de diversas > versões possíves e imagináveis > (graças ao svn) e nada. As temperaturas dos processadores central, > gráfico e da placa mãe > normais, coloquei uma fonte nova de 400 velas e também não resolveu, > desliguei journal, > softupdates (esse doeu porque leva uma vida pra verificar um slice de > 1G!). Suspeitei do disco SATA2 na interface SATA1 e de algum binário > corrompído (tenho cerca de 2800 ports > compilados e nem todos estão atualizados), então reinstalei o 10R em > um disco IDE velho > que tinha aqui e fui reconstruindo o sistema com binários, o > windowmaker e o xosview nem > abrem dão 11 direto (é só abrir, pelo menos sem pane), mas ao ver > flash no firefox, pane, > reiniciar, pane denovo, gqview, pane. Não era software. > > Aqui em Curitiba chegou o armagedom, e com isso as panes ficaram mais > frequentes, mesmo com tudo limpinho e brilhante. Percebi que de vez em > quando o X dava > sinal 6 e outras 10 (bus error!), descobri que quem throlla esse > sinal é o processador, > que andava a não mais que 60°C a todo o vapor. Suspeitei de algum > problema na ponte > norte, então baixei a velocidade do barramento frontal (FSB) para > 100MHz (que era o > mínimo que dava) e as panes pararam! Estressei ele bastante e não > ocorreu nenhuma pane, > até não foi difícil porque ele tava uma lesma mesmo e para ir a 2.5 de > carga não precisava > muito. > > No notebook do trampo o cooler estava entupido de poeira e até > descobrir como desmontava aquela bomba (um HP6515b, no youtube tem a > manha de um parafuseco escondido) eu baixava o clock pra não derreter > tudo enquanto procurava no google, então o diagnóstico de temperatura > (ainda mais em dias quentes) estava valendo, mas nenhum dos sensores > apontava anormalidade em casa. > > Resolvi então desmontar o dissipador da ponte norte (PM4800CE) e tive > a surpresa. Até tinha uma camada de pasta no dissipador mas só deixou > marca nas bordas de plástico > do chip, a moeda central (que é de metal) estava sem uma mancha de > pasta! Nem sei > como durou tanto tempo (ela já tem 7 anos). Melequei tudo de pasta, me > empolguei e soquei na placa de video também (o que não foi uma boa > ideia porque lá é aquela fita térmica que não sai, mas ficou toda > lambuzada também). Ou seja, os sensores da placa > mãe não pegam esse defeito, os programas de benchmark não conseguem > esquentá-lo > o suficiente e os coredumps não dizem na da de relevante. É de perder > os cabelos. > > Se algum gringo tiver tendo esse problema também e por infelicidade > encontrar isso e não entender nada, vai aqui resumidamente em outras > palavras: > > Overheating at the Northbridge, lack of thermal paste under the sink > generating random > page faults even under the normal conditions in the sensors and > aproval of the smartd, > memtest and bonnie. That is a tip. > > Abração à todos. > - > Histórico: http://www.fug.com.br/historico/html/freebsd/ > Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd É grande isso realmente incomoda muito, a HP saiu da minha lista de notebooks confiáveis depois da serie Pavillion DV6000 com pane no northbridge/GPU. O lado bom é que está solucionado, valeu por ter compartilhado. Att. -- Paulo Henrique. Grupo de Usuários do FreeBSD no Brasil. Fone: (21) 96713-5042 - Histórico: http://www.fug.com.br/historico/html/freebsd/ Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
[FUG-BR] Fatal trap 12: page fault while in kernel mode [SOLVED] (16 meses depois)
Olá Caríssimos! É com muito prazer que compartilho com os senhores e senhoras um probleminha encardido que vinha me perturbando deste setembro de 2012, "Fatal trap 12: page fault while in kernel mode", abaixo vou contar a historinha, no último parágrafo a solução. Eu poderia ficar o dia inteiro lendo notícias, programando que não dava nada, esporadicamente o sistema panicava, vendo vídeo, baixando torrents, copiando grandes arquivos (mesmo em modo solteiro [single]), nada coerente, consegui modelar a cabeça de um soldado imperial inteira no blender e de vez em quando ao renderizar panicava, não em todas. Compilar o kernel/userland também, de vez em quando ia tudo, de vez em quando parava (compilei a 8.2, 9.1, 9.2 e 10, cheguei à conclusão que não era a versão, hehe). Para ajudar tinham alguns reboots causados por inconsistências devido às constantes panes que só tornavam o problema mais nebuloso, ocorriam panes até em idle, sinistro. Os dumps vinham como se tivesse vazado bit pra todo lado, números absurdos nos mbufs, interfaces de rede e nos indicadores de paginação, esse até faz sentido já que a falha é de paginação, mas um não tinha nada a ver com outro, pareciam que vinham de máquinas diferentes. A Primeira suspeita é a memória, passei o memtest86+ diversas vezes e não apontava nada. Reinstalei todos os kernel drivers de diversas versões possíves e imagináveis (graças ao svn) e nada. As temperaturas dos processadores central, gráfico e da placa mãe normais, coloquei uma fonte nova de 400 velas e também não resolveu, desliguei journal, softupdates (esse doeu porque leva uma vida pra verificar um slice de 1G!). Suspeitei do disco SATA2 na interface SATA1 e de algum binário corrompído (tenho cerca de 2800 ports compilados e nem todos estão atualizados), então reinstalei o 10R em um disco IDE velho que tinha aqui e fui reconstruindo o sistema com binários, o windowmaker e o xosview nem abrem dão 11 direto (é só abrir, pelo menos sem pane), mas ao ver flash no firefox, pane, reiniciar, pane denovo, gqview, pane. Não era software. Aqui em Curitiba chegou o armagedom, e com isso as panes ficaram mais frequentes, mesmo com tudo limpinho e brilhante. Percebi que de vez em quando o X dava sinal 6 e outras 10 (bus error!), descobri que quem throlla esse sinal é o processador, que andava a não mais que 60°C a todo o vapor. Suspeitei de algum problema na ponte norte, então baixei a velocidade do barramento frontal (FSB) para 100MHz (que era o mínimo que dava) e as panes pararam! Estressei ele bastante e não ocorreu nenhuma pane, até não foi difícil porque ele tava uma lesma mesmo e para ir a 2.5 de carga não precisava muito. No notebook do trampo o cooler estava entupido de poeira e até descobrir como desmontava aquela bomba (um HP6515b, no youtube tem a manha de um parafuseco escondido) eu baixava o clock pra não derreter tudo enquanto procurava no google, então o diagnóstico de temperatura (ainda mais em dias quentes) estava valendo, mas nenhum dos sensores apontava anormalidade em casa. Resolvi então desmontar o dissipador da ponte norte (PM4800CE) e tive a surpresa. Até tinha uma camada de pasta no dissipador mas só deixou marca nas bordas de plástico do chip, a moeda central (que é de metal) estava sem uma mancha de pasta! Nem sei como durou tanto tempo (ela já tem 7 anos). Melequei tudo de pasta, me empolguei e soquei na placa de video também (o que não foi uma boa ideia porque lá é aquela fita térmica que não sai, mas ficou toda lambuzada também). Ou seja, os sensores da placa mãe não pegam esse defeito, os programas de benchmark não conseguem esquentá-lo o suficiente e os coredumps não dizem na da de relevante. É de perder os cabelos. Se algum gringo tiver tendo esse problema também e por infelicidade encontrar isso e não entender nada, vai aqui resumidamente em outras palavras: Overheating at the Northbridge, lack of thermal paste under the sink generating random page faults even under the normal conditions in the sensors and aproval of the smartd, memtest and bonnie. That is a tip. Abração à todos. - Histórico: http://www.fug.com.br/historico/html/freebsd/ Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
Re: [FUG-BR] Fatal trap 12: page fault while in kernel mode
Em Qua, 2006-11-29 às 12:25 -0300, audeni escreveu: > - Original Message - > From: "Anderson Michel" <[EMAIL PROTECTED]> > To: "Lista de discussao do grupo FUG-BR" > Sent: Wednesday, November 29, 2006 11:38 AM > Subject: [FUG-BR] Fatal trap 12: page fault while in kernel mode > > > Pessoal, > > Estou tendo problemas com um Servidor de e-mail, que "tem vontade > própria e reinicia sozinho, rsrs". > > Analisando o /var/log/messages tenho algumas informações: > > syslogd: kernel boot file is /boot/kernel/kernel > kernel: > kernel: Fatal trap 12: page fault while in kernel mode > kernel: cpuid = 2; apic id = 06 > kernel: fault virtual address = 0xac > kernel: fault code = supervisor write, page not present > kernel: instruction pointer = 0x20:0xc05a4808 > kernel: stack pointer = 0x28:0xe8698b18 > kernel: frame pointer = 0x28:0xe8698b34 > kernel: code segment= base 0x0, limit 0xf, type 0x1b > kernel: = DPL 0, pres 1, def32 1, gran 1 > kernel: processor eflags= interrupt enabled, resume, IOPL = 0 > kernel: current process = 33942 (tcpserver) > kernel: trap number = 12 > kernel: panic: page fault > kernel: cpuid = 2 > > No Google encontrei o seguinte: > http://www.freebsd.org/doc/pt_BR.ISO8859-1/books/faq/advanced.html#KERNEL-PANIC-TROUBLESHOOTING > > E executei o comando conforme descrito e obtive o seguinte resultado: > > server# nm -n /boot/kernel/kernel | grep 0xc05a4808 > server# nm -n /boot/kernel/kernel | grep c05a4808 > server# nm -n /boot/kernel/kernel | grep c05a480 > server# nm -n /boot/kernel/kernel | grep c05a48 > server# nm -n /boot/kernel/kernel | grep c05a4 > c05a41ac T ip_fragment > c05a44f8 T in_delayed_cksum > c05a456c t ip_insertoptions > c05a46b0 T ip_optcopy > c05a4744 T ip_ctloutput > c05a4f3c t ip_pcbopts > server# > > Essa máquina tem 2 processadores Xeon e 1GB RAM. > Está instalado o FreeBSD 6.1-RELEASE. > E rodando qmail+vpopmail+qmailscanner+spamassassin. > > Estou desconfiado que seja a memória c/ problema, alguém tem alguma luz? > Obs.: estou providênciando outra memória pra testes, ainda não chegou. > > Tem algum outro procedimento a fazer?? > > Obrigado, > > Anderson Michel > - Sim , use SEMPRE dois pentes de memorias se possivel ecc, se um der problemas trabalha meia boca até vc arrumar outro pente de memória -- Marcello Costa BSD System Engineer unixmafia at yahoo dot com dot br FUG-BR #156 http://www.fug.com.br ___ Voc� quer respostas para suas perguntas? Ou voc� sabe muito e quer compartilhar seu conhecimento? Experimente o Yahoo! Respostas ! http://br.answers.yahoo.com/ - Histórico: http://www.fug.com.br/historico/html/freebsd/ Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
Re: [FUG-BR] Fatal trap 12: page fault while in kernel mode
- Original Message - From: "Anderson Michel" <[EMAIL PROTECTED]> To: "Lista de discussao do grupo FUG-BR" Sent: Wednesday, November 29, 2006 11:38 AM Subject: [FUG-BR] Fatal trap 12: page fault while in kernel mode Pessoal, Estou tendo problemas com um Servidor de e-mail, que "tem vontade própria e reinicia sozinho, rsrs". Analisando o /var/log/messages tenho algumas informações: syslogd: kernel boot file is /boot/kernel/kernel kernel: kernel: Fatal trap 12: page fault while in kernel mode kernel: cpuid = 2; apic id = 06 kernel: fault virtual address = 0xac kernel: fault code = supervisor write, page not present kernel: instruction pointer = 0x20:0xc05a4808 kernel: stack pointer = 0x28:0xe8698b18 kernel: frame pointer = 0x28:0xe8698b34 kernel: code segment= base 0x0, limit 0xf, type 0x1b kernel: = DPL 0, pres 1, def32 1, gran 1 kernel: processor eflags= interrupt enabled, resume, IOPL = 0 kernel: current process = 33942 (tcpserver) kernel: trap number = 12 kernel: panic: page fault kernel: cpuid = 2 No Google encontrei o seguinte: http://www.freebsd.org/doc/pt_BR.ISO8859-1/books/faq/advanced.html#KERNEL-PANIC-TROUBLESHOOTING E executei o comando conforme descrito e obtive o seguinte resultado: server# nm -n /boot/kernel/kernel | grep 0xc05a4808 server# nm -n /boot/kernel/kernel | grep c05a4808 server# nm -n /boot/kernel/kernel | grep c05a480 server# nm -n /boot/kernel/kernel | grep c05a48 server# nm -n /boot/kernel/kernel | grep c05a4 c05a41ac T ip_fragment c05a44f8 T in_delayed_cksum c05a456c t ip_insertoptions c05a46b0 T ip_optcopy c05a4744 T ip_ctloutput c05a4f3c t ip_pcbopts server# Essa máquina tem 2 processadores Xeon e 1GB RAM. Está instalado o FreeBSD 6.1-RELEASE. E rodando qmail+vpopmail+qmailscanner+spamassassin. Estou desconfiado que seja a memória c/ problema, alguém tem alguma luz? Obs.: estou providênciando outra memória pra testes, ainda não chegou. Tem algum outro procedimento a fazer?? Obrigado, Anderson Michel - Histórico: http://www.fug.com.br/historico/html/freebsd/ Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd - Histórico: http://www.fug.com.br/historico/html/freebsd/ Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
Re: [FUG-BR] Fatal trap 12: page fault while in kernel mode
page fault é problema de memória. Tente limpar com borracha a memória, tirar a estática ou então troque-a -- "Linux is for people who hate Windows, BSD is for people who love UNIX" Freebsd-BR User #88 --- Giancarlo Rubio - Histórico: http://www.fug.com.br/historico/html/freebsd/ Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
[FUG-BR] Fatal trap 12: page fault while in kernel mode
Pessoal, Estou tendo problemas com um Servidor de e-mail, que "tem vontade própria e reinicia sozinho, rsrs". Analisando o /var/log/messages tenho algumas informações: syslogd: kernel boot file is /boot/kernel/kernel kernel: kernel: Fatal trap 12: page fault while in kernel mode kernel: cpuid = 2; apic id = 06 kernel: fault virtual address = 0xac kernel: fault code = supervisor write, page not present kernel: instruction pointer = 0x20:0xc05a4808 kernel: stack pointer = 0x28:0xe8698b18 kernel: frame pointer = 0x28:0xe8698b34 kernel: code segment= base 0x0, limit 0xf, type 0x1b kernel: = DPL 0, pres 1, def32 1, gran 1 kernel: processor eflags= interrupt enabled, resume, IOPL = 0 kernel: current process = 33942 (tcpserver) kernel: trap number = 12 kernel: panic: page fault kernel: cpuid = 2 No Google encontrei o seguinte: http://www.freebsd.org/doc/pt_BR.ISO8859-1/books/faq/advanced.html#KERNEL-PANIC-TROUBLESHOOTING E executei o comando conforme descrito e obtive o seguinte resultado: server# nm -n /boot/kernel/kernel | grep 0xc05a4808 server# nm -n /boot/kernel/kernel | grep c05a4808 server# nm -n /boot/kernel/kernel | grep c05a480 server# nm -n /boot/kernel/kernel | grep c05a48 server# nm -n /boot/kernel/kernel | grep c05a4 c05a41ac T ip_fragment c05a44f8 T in_delayed_cksum c05a456c t ip_insertoptions c05a46b0 T ip_optcopy c05a4744 T ip_ctloutput c05a4f3c t ip_pcbopts server# Essa máquina tem 2 processadores Xeon e 1GB RAM. Está instalado o FreeBSD 6.1-RELEASE. E rodando qmail+vpopmail+qmailscanner+spamassassin. Estou desconfiado que seja a memória c/ problema, alguém tem alguma luz? Obs.: estou providênciando outra memória pra testes, ainda não chegou. Tem algum outro procedimento a fazer?? Obrigado, Anderson Michel - Histórico: http://www.fug.com.br/historico/html/freebsd/ Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd