[CentOS-es] Problema con mtrr Centos 5.3 Kernel i386 2.6.18-128.2.1.PAE

2009-07-31 Por tema Carlos German Tejero
Al final les cuento que hoy me decidi y descargue y compile el kernel
2.6.30.3 de kernel.org. Funciono perfecto y no tuve mayores problemas, salvo
unos modules para el kernel de sunray, gracias a dios alguien los habia
modificado para el kernel 2.6.29, y con esas modificaciones anduvo todo ok.
Ahora el /proc/mtrr reporta los valores esperados y hasta es posible
modificarlo normalmente, en el dmesg tira el mensaje de que mi BIOS setea la
mascara en el mtrr de forma incorrecta y dice que lo corrige. Realmente no
se a quien creerle, si al fabricante o a los desarrolladores del kernel.
Igual por suerte pude sortear el obstáculo.

> Has probado a arrancar con todas las sugerencias de parámetros
> relativos a acpi, etc?

No, no creo que tenga que ver con acpi, el problema es el mtrr

>Has buscado si hay un reporte de tu problema registrado como bug del
>kernel (http://bugzilla.kernel.org/)? O en Red Hat
>(https://bugzilla.redhat.com/)>? Busca con algo como "mtrr freeze" o
>mencionando el modelo de motherboard.

No realmente no tuve mucho tiempo, necesitaba poner el server online lo
antes posible

>Has probado a reemplazar la memoria, intercambiar bancos de lugar, o
>reducir el tamaño de la memoria, y registrar si hay diferencias en el
>dmesg de los sucesivos arranques? Eso puede orientarte en la búsqueda
>del presunto bug.

Probe con todas las configuraciones posibles de memoria, y nada, el
/proc/mtrr sigue mal

>Si no lo hay y ninguna de las cosas que pruebes arregla tu problema,
>deberías pensar en registrar un bug.

Puede que el lunes lo reporte, pero me parece que es un problema ya
conocido.

>Has probado el kernel de centosplus?

Si tambien probe por las dudas

Saludos

-- 
Carlos Germán Tejero
___
CentOS-es mailing list
CentOS-es@centos.org
http://lists.centos.org/mailman/listinfo/centos-es


Re: [CentOS-es] Problema con mtrr Centos 5.3 Kernel i386 2.6.18-128.2.1.PAE

2009-07-30 Por tema Eduardo Grosclaude
2009/7/30 Carlos German Tejero :
> Buenas a todos, esta es la primera vez que escribo a la lista, soy german
> tejero de argentina.
> Tengo un problema con el que estoy lidiando hace una semana y no he podido
> resolverlo, siempre he podido resolver todo mis problemas con linux, pero
> esta vez me supero.
> Mi escenario es el siguiente.
> Tengo un servidor HP Proliant ML370G5, con 10GB RAM, dos procesadores Xeon
> QuadCore, con el que servio a unos cuantos usuarios de Sunray.
> El tema es que el servidor se empezo a congelar sin razon. Utilizando dmesg
> + kdump + crash di con que que el kernel esta tomando valores incorrectos
> del mtrr, si hago cat /proc/mtrr retorna dos rangos con tamaños de 200GB.
> Utilizando LiveCD de ubuntu 9.04 y Fedora di con que el kernel 2.6.28 toma
> bien los valores y opera normalmente.
> Intente pasar los rangos al mtrr por linea de comandos utilizando echo pero
> el servidor se cuelga o no me toma los valores. Escribi un programa en C
> utilizando ioctl para modificar el mtrr, pero tampoco me permite modificar
> los valores. Ahora tengo tres caminos posibles:
>
> 1.- Pachear el kernel para corregir el error del mtrr o harcodear los rangos
> 2.- Compilar un kernel 2.6.28 o superior, y configurarlo para centos 5
> 3.- Instalar una distribucion con kernel mas moderno y virtualizar sobre el
> centos 5
>
> ¿Que me recomiendan? ¿Alguno de ustedes a tenido problemas con el mtrr?

Nunca

> ¿Pudieron solucionarlos?
>
> Ideas y sugerencias son realmente bienvenidas!!!
>
Cómo se ve exactamente /proc/mtrr con el kernel que falla y con uno "bueno"?

Has probado a arrancar con todas las sugerencias de parámetros
relativos a acpi, etc?

Has buscado si hay un reporte de tu problema registrado como bug del
kernel (http://bugzilla.kernel.org/)? O en Red Hat
(https://bugzilla.redhat.com/)? Busca con algo como "mtrr freeze" o
mencionando el modelo de motherboard.

Has probado a reemplazar la memoria, intercambiar bancos de lugar, o
reducir el tamaño de la memoria, y registrar si hay diferencias en el
dmesg de los sucesivos arranques? Eso puede orientarte en la búsqueda
del presunto bug.

Si no lo hay y ninguna de las cosas que pruebes arregla tu problema,
deberías pensar en registrar un bug.

Has probado el kernel de centosplus?

-- 
Eduardo Grosclaude
Universidad Nacional del Comahue
Neuquen, Argentina
___
CentOS-es mailing list
CentOS-es@centos.org
http://lists.centos.org/mailman/listinfo/centos-es


[CentOS-es] Problema con mtrr Centos 5.3 Kernel i386 2.6.18-128.2.1.PAE

2009-07-30 Por tema Carlos German Tejero
Buenas a todos, esta es la primera vez que escribo a la lista, soy german
tejero de argentina.
Tengo un problema con el que estoy lidiando hace una semana y no he podido
resolverlo, siempre he podido resolver todo mis problemas con linux, pero
esta vez me supero.
Mi escenario es el siguiente.
Tengo un servidor HP Proliant ML370G5, con 10GB RAM, dos procesadores Xeon
QuadCore, con el que servio a unos cuantos usuarios de Sunray.
El tema es que el servidor se empezo a congelar sin razon. Utilizando dmesg
+ kdump + crash di con que que el kernel esta tomando valores incorrectos
del mtrr, si hago cat /proc/mtrr retorna dos rangos con tamaños de 200GB.
Utilizando LiveCD de ubuntu 9.04 y Fedora di con que el kernel 2.6.28 toma
bien los valores y opera normalmente.
Intente pasar los rangos al mtrr por linea de comandos utilizando echo pero
el servidor se cuelga o no me toma los valores. Escribi un programa en C
utilizando ioctl para modificar el mtrr, pero tampoco me permite modificar
los valores. Ahora tengo tres caminos posibles:

1.- Pachear el kernel para corregir el error del mtrr o harcodear los rangos
2.- Compilar un kernel 2.6.28 o superior, y configurarlo para centos 5
3.- Instalar una distribucion con kernel mas moderno y virtualizar sobre el
centos 5

¿Que me recomiendan? ¿Alguno de ustedes a tenido problemas con el mtrr?
¿Pudieron solucionarlos?

Ideas y sugerencias son realmente bienvenidas!!!

Saludos

-- 
Carlos Germán Tejero
___
CentOS-es mailing list
CentOS-es@centos.org
http://lists.centos.org/mailman/listinfo/centos-es