Re: Problemas para rearmar RAID1

2015-12-04 Por tema Camaleón
El Fri, 04 Dec 2015 11:02:15 -0300, Mauro Antivero escribió:

> El 04/12/15 a las 10:40, Jorge A. Secreto escribió:

(...)

>>> Ahora tendría entonces que armar un RAID1 entre un disco de 500 GB y
>>> uno de 1 TB, lo cual hasta donde yo se no es ningún problema (se
>>> desperdiciarán 500 GB si, pero no hay problema con eso) pero no logro
>>> hacerlo... Les paso los datos sobre la configuración RAID:
>> .
>>
>>> Dec  4 09:36:27 dexter kernel: [30239.165898] sd 1:0:0:0: [sdb] Unhandled 
>>> sense code 
>>> Dec  4 09:36:27 dexter kernel: [30239.165900] sd 1:0:0:0: [sdb] Result: 
>>> hostbyte=DID_OK driverbyte=DRIVER_SENSE 
>>> Dec  4 09:36:27 dexter kernel: [30239.165903] sd 1:0:0:0: [sdb] Sense Key : 
>>> Medium Error [current] [descriptor]
>>> Dec  4 09:36:27 dexter kernel: [30239.165908] Descriptor sense data with 
>>> sense descriptors (in hex):
>>> Dec  4 09:36:27 dexter kernel: [30239.165910] 72 03 11 04 00 00 00 
>>> 0c 00 0a 80 00 00 00 00 00 
>>> Dec  4 09:36:27 dexter kernel: [30239.165926] 00 b2 e0 00 
>>> Dec  4 09:36:27 dexter kernel: [30239.165928] sd 1:0:0:0: [sdb] Add. Sense: 
>>> Unrecovered read error - auto reallocate failed 
>>> Dec  4 09:36:27 dexter kernel: [30239.165930] sd 1:0:0:0: [sdb] CDB: 
>>> Read(10): 28 00 00 b2 e0 00 00 00 08 00 
>>> Dec  4 09:36:27 dexter kernel: [30239.166078] ata2: EH complete
>>>
>> A lo mejor  estoy diciendo una estupidez pero ¿chequeaste que el disco
>> nuevo no este roto?
>> ¿SMART qué te dice?
> La verdad que no lo verifiqué, estaba pensando justamente en hacer eso.
> Para verificar el SMART puedo usar smartctl (ahora me fijo las
> opciones), pero para verificar los sectores en si qué me recomiendan?
> Estaba pensando en usar "badblocks -svw /dev/sdb", lo cual puede tener
> la ventaja que escribe todo el disco, con lo cual es posible que si hay
> algún error medio "tonto" molestando con este se solucione.
> 
> Cualquier otra sugerencia es bienvenida. Saludos y muchas gracias,

Usa el disco del fabricante (WD) y pasa el test largo. Usa smartmontools 
para saber si el disco te lo han vendido nuevo o de segunda mano (eso lo 
ves en el registro de horas de uso) y sí, yo también he pensando que el 
disco (sdb) tiene errores.

Saludos,

-- 
Camaleón



Problemas para rearmar RAID1

2015-12-04 Por tema Mauro Antivero
Estimados, tenemos un servidor con dos discos WD de 500 GB en RAID1. El 
server es un Dell R210 II, por lo que originalmente tenía dos discos WD 
de 500 certificados por Dell como "Enterprise Class". Hace un tiempo uno 
de estos discos comenzó a dar problemas así que lo reemplazamos por otro 
de 500. Para los que estén en Argentina o conozcan como es la situación 
acá entenderán los difícil, caro y largo que se hace conseguir un disco 
original, entonces como teníamos que reemplazarlo lo antes posible 
usamos un WD Blue (de 500 GB) que es lo que conseguimos acá a mano. Todo 
salió bien, se copió la tabla de particiones, se rearmó el RAID y 
sincronizó, todo perfecto sin problemas.


Ahora, desde hace unos días que el otro de los discos originales que 
quedaba (el otro certificado por Dell digamos) empezó a andar mal 
(básicamente bastante lento, el servidor seguía operando pero se notaba 
mucho un impacto en la performance) así que ayer a la noche hicimos el 
cambio. En este caso conseguimos un dico WD "Black" de 1 TB, el cual si 
bien es un disco catalogado para "Desktop" en teoría sería mejor que un 
"Blue", así que optamos por este disco.


Ahora tendría entonces que armar un RAID1 entre un disco de 500 GB y uno 
de 1 TB, lo cual hasta donde yo se no es ningún problema (se 
desperdiciarán 500 GB si, pero no hay problema con eso) pero no logro 
hacerlo... Les paso los datos sobre la configuración RAID:


cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 sdb3[3](F) sda3[2]
  472759160 blocks super 1.2 [2/1] [U_]

md2 : active raid1 sda2[2]
  9764792 blocks super 1.2 [2/1] [U_]

md1 : active raid1 sda1[2]
  5857268 blocks super 1.2 [2/1] [U_]

Entonces para rearmar el RAID hago lo siguiente:

mdadm --manage /dev/md0 --add /dev/sdb3
mdadm --manage /dev/md1 --add /dev/sdb1
mdadm --manage /dev/md2 --add /dev/sdb2

Pero extrañamente sucede lo siguiente:

mdadm --manage /dev/md0 --add /dev/sdb3 <--- Comienza la sincronización
mdadm --manage /dev/md1 --add /dev/sdb1 <--- Comienza la sincronización
mdadm --manage /dev/md2 --add /dev/sdb2 <--- Me da error: "mdadm: add 
new device failed for /dev/sdb2 as 3: Invalid argument"


Pero esto no termina acá... He Googleado un poco y hecho varias pruebas, 
una de ellas era marcar las partición como "fail" (mdadm --manage 
/dev/mdX --fail /dev/sdbY), luego eliminarlas (mdadm --manage /dev/mdX 
--remove /dev/sdbY) para finalmente volverlas a agregar. Pero esta vez 
cuando lo hago sucede lo siguiente:


mdadm --manage /dev/md0 --add /dev/sdb3 <--- Comienza la sincronización
mdadm --manage /dev/md1 --add /dev/sdb1 <--- Me da error: "mdadm: add 
new device failed for /dev/sdb1 as 3: Invalid argument"
mdadm --manage /dev/md2 --add /dev/sdb2 <--- Me da error: "mdadm: add 
new device failed for /dev/sdb2 as 3: Invalid argument"


Pero la cosa no termina acá. Como "al menos" la sincronización de md0 
comenzó lo dejé sincronizando toda la madrugada, solo para darme cuenta 
hoy a la mañana que la misma no se realizó (un cat /proc/mdstat actual 
muestra lo que puse más arriba, es decir ningún partición sincronizada 
ni en proceso de sincronización). Entonces si miro el log cuando quiero 
rearmar el RAID obtengo lo siguiente (ejemplo para md2):


mdadm --manage /dev/md2 --add /dev/sdb2
mdadm: add new device failed for /dev/sdb2 as 3: Invalid argument

cat /var/log/messages (pongo solo una porción del log porque el log 
generado cuando intento el comando anterior es larguísimo)


Dec  4 09:36:05 dexter kernel: [30217.078158] ata2: EH complete
Dec  4 09:36:09 dexter kernel: [30220.760996] ata2.00: configured for 
UDMA/133

Dec  4 09:36:09 dexter kernel: [30220.761001] ata2: EH complete
Dec  4 09:36:12 dexter kernel: [30224.441795] ata2.00: configured for 
UDMA/133

Dec  4 09:36:12 dexter kernel: [30224.441808] ata2: EH complete
Dec  4 09:36:16 dexter kernel: [30228.123129] ata2.00: configured for 
UDMA/133

Dec  4 09:36:16 dexter kernel: [30228.123149] ata2: EH complete
Dec  4 09:36:20 dexter kernel: [30231.803857] ata2.00: configured for 
UDMA/133

Dec  4 09:36:20 dexter kernel: [30231.803863] ata2: EH complete
Dec  4 09:36:23 dexter kernel: [30235.484692] ata2.00: configured for 
UDMA/133

Dec  4 09:36:23 dexter kernel: [30235.484697] ata2: EH complete
Dec  4 09:36:27 dexter kernel: [30239.165886] ata2.00: configured for 
UDMA/133
Dec  4 09:36:27 dexter kernel: [30239.165898] sd 1:0:0:0: [sdb] 
Unhandled sense code
Dec  4 09:36:27 dexter kernel: [30239.165900] sd 1:0:0:0: [sdb] Result: 
hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec  4 09:36:27 dexter kernel: [30239.165903] sd 1:0:0:0: [sdb] Sense 
Key : Medium Error [current] [descriptor]
Dec  4 09:36:27 dexter kernel: [30239.165908] Descriptor sense data with 
sense descriptors (in hex):
Dec  4 09:36:27 dexter kernel: [30239.165910] 72 03 11 04 00 00 
00 0c 00 0a 80 00 00 00 00 00

Dec  4 09:36:27 dexter kernel: [30239.165926] 00 b2 e0 00
Dec  4 09:36:27 dexter kernel: [30239.165928] sd 1:0:0:0: 

Re: Problemas para rearmar RAID1

2015-12-04 Por tema Mauro Antivero

El 04/12/15 a las 10:40, Jorge A. Secreto escribió:

Hola Mauro

El 4 de diciembre de 2015, 9:46, Mauro Antivero
 escribió:

Estimados, tenemos un servidor con dos discos WD de 500 GB en RAID1. El server es un Dell 
R210 II, por lo que originalmente tenía dos discos WD de 500 certificados por Dell como 
"Enterprise Class". Hace un tiempo uno de estos discos comenzó a dar problemas 
así que lo reemplazamos por otro de 500. Para los que estén en Argentina o conozcan como 
es la situación acá entenderán los difícil, caro y largo que se hace conseguir un disco 
original, entonces como teníamos que reemplazarlo lo antes posible usamos un WD Blue (de 
500 GB) que es lo que conseguimos acá a mano. Todo salió bien, se copió la tabla de 
particiones, se rearmó el RAID y sincronizó, todo perfecto sin problemas.

Ahora, desde hace unos días que el otro de los discos originales que quedaba (el otro certificado por Dell 
digamos) empezó a andar mal (básicamente bastante lento, el servidor seguía operando pero se notaba mucho un 
impacto en la performance) así que ayer a la noche hicimos el cambio. En este caso conseguimos un dico WD 
"Black" de 1 TB, el cual si bien es un disco catalogado para "Desktop" en teoría sería 
mejor que un "Blue", así que optamos por este disco.

Ahora tendría entonces que armar un RAID1 entre un disco de 500 GB y uno de 1 
TB, lo cual hasta donde yo se no es ningún problema (se desperdiciarán 500 GB 
si, pero no hay problema con eso) pero no logro hacerlo... Les paso los datos 
sobre la configuración RAID:

.


Dec  4 09:36:27 dexter kernel: [30239.165898] sd 1:0:0:0: [sdb] Unhandled sense 
code
Dec  4 09:36:27 dexter kernel: [30239.165900] sd 1:0:0:0: [sdb] Result: 
hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec  4 09:36:27 dexter kernel: [30239.165903] sd 1:0:0:0: [sdb] Sense Key : 
Medium Error [current] [descriptor]
Dec  4 09:36:27 dexter kernel: [30239.165908] Descriptor sense data with sense 
descriptors (in hex):
Dec  4 09:36:27 dexter kernel: [30239.165910] 72 03 11 04 00 00 00 0c 
00 0a 80 00 00 00 00 00
Dec  4 09:36:27 dexter kernel: [30239.165926] 00 b2 e0 00
Dec  4 09:36:27 dexter kernel: [30239.165928] sd 1:0:0:0: [sdb] Add. Sense: 
Unrecovered read error - auto reallocate failed
Dec  4 09:36:27 dexter kernel: [30239.165930] sd 1:0:0:0: [sdb] CDB: Read(10): 
28 00 00 b2 e0 00 00 00 08 00
Dec  4 09:36:27 dexter kernel: [30239.166078] ata2: EH complete


A lo mejor  estoy diciendo una estupidez pero ¿chequeaste que el disco
nuevo no este roto?
¿SMART qué te dice?
La verdad que no lo verifiqué, estaba pensando justamente en hacer eso. 
Para verificar el SMART puedo usar smartctl (ahora me fijo las 
opciones), pero para verificar los sectores en si qué me recomiendan? 
Estaba pensando en usar "badblocks -svw /dev/sdb", lo cual puede tener 
la ventaja que escribe todo el disco, con lo cual es posible que si hay 
algún error medio "tonto" molestando con este se solucione.


Cualquier otra sugerencia es bienvenida. Saludos y muchas gracias,

Mauro.




Y hasta acá llegué... Estoy leyendo pero aún no encuentro nada. En el peor de los casos 
se me ocurre pasar el sistema completo de un disco a otro con rsync, instalar grub en el 
disco nuevo y arrancar el sistema con el disco nuevo para finalmente agregar otro disco 
de 1TB e intentar rearmar el RAID (en todo caso deseamos usar para este servidor dos 
discos "Black", pasa que de momento solo conseguimos uno).

Les agradecería mucho cualquier comentario al respecto. Realmente no me doy una 
idea de lo que puede estar pasando. Recuerdo haber rearmado RAID1 así de esta 
forma (es decir que originalmente es de 500 pero al momento de reemplazar el 
disco solo se consigue uno de 1 TB o más) y no he tenido ningún problema...




Como siempre, cualquier ayuda es bienvenida. Saludos y muchas gracias,

Mauro.


un abrazo






Re: Problemas para rearmar RAID1

2015-12-04 Por tema Jorge A. Secreto
Hola Mauro

El 4 de diciembre de 2015, 9:46, Mauro Antivero
 escribió:
>
> Estimados, tenemos un servidor con dos discos WD de 500 GB en RAID1. El 
> server es un Dell R210 II, por lo que originalmente tenía dos discos WD de 
> 500 certificados por Dell como "Enterprise Class". Hace un tiempo uno de 
> estos discos comenzó a dar problemas así que lo reemplazamos por otro de 500. 
> Para los que estén en Argentina o conozcan como es la situación acá 
> entenderán los difícil, caro y largo que se hace conseguir un disco original, 
> entonces como teníamos que reemplazarlo lo antes posible usamos un WD Blue 
> (de 500 GB) que es lo que conseguimos acá a mano. Todo salió bien, se copió 
> la tabla de particiones, se rearmó el RAID y sincronizó, todo perfecto sin 
> problemas.
>
> Ahora, desde hace unos días que el otro de los discos originales que quedaba 
> (el otro certificado por Dell digamos) empezó a andar mal (básicamente 
> bastante lento, el servidor seguía operando pero se notaba mucho un impacto 
> en la performance) así que ayer a la noche hicimos el cambio. En este caso 
> conseguimos un dico WD "Black" de 1 TB, el cual si bien es un disco 
> catalogado para "Desktop" en teoría sería mejor que un "Blue", así que 
> optamos por este disco.
>
> Ahora tendría entonces que armar un RAID1 entre un disco de 500 GB y uno de 1 
> TB, lo cual hasta donde yo se no es ningún problema (se desperdiciarán 500 GB 
> si, pero no hay problema con eso) pero no logro hacerlo... Les paso los datos 
> sobre la configuración RAID:

.

>
> Dec  4 09:36:27 dexter kernel: [30239.165898] sd 1:0:0:0: [sdb] Unhandled 
> sense code
> Dec  4 09:36:27 dexter kernel: [30239.165900] sd 1:0:0:0: [sdb] Result: 
> hostbyte=DID_OK driverbyte=DRIVER_SENSE
> Dec  4 09:36:27 dexter kernel: [30239.165903] sd 1:0:0:0: [sdb] Sense Key : 
> Medium Error [current] [descriptor]
> Dec  4 09:36:27 dexter kernel: [30239.165908] Descriptor sense data with 
> sense descriptors (in hex):
> Dec  4 09:36:27 dexter kernel: [30239.165910] 72 03 11 04 00 00 00 0c 
> 00 0a 80 00 00 00 00 00
> Dec  4 09:36:27 dexter kernel: [30239.165926] 00 b2 e0 00
> Dec  4 09:36:27 dexter kernel: [30239.165928] sd 1:0:0:0: [sdb] Add. Sense: 
> Unrecovered read error - auto reallocate failed
> Dec  4 09:36:27 dexter kernel: [30239.165930] sd 1:0:0:0: [sdb] CDB: 
> Read(10): 28 00 00 b2 e0 00 00 00 08 00
> Dec  4 09:36:27 dexter kernel: [30239.166078] ata2: EH complete
>

A lo mejor  estoy diciendo una estupidez pero ¿chequeaste que el disco
nuevo no este roto?
¿SMART qué te dice?


> Y hasta acá llegué... Estoy leyendo pero aún no encuentro nada. En el peor de 
> los casos se me ocurre pasar el sistema completo de un disco a otro con 
> rsync, instalar grub en el disco nuevo y arrancar el sistema con el disco 
> nuevo para finalmente agregar otro disco de 1TB e intentar rearmar el RAID 
> (en todo caso deseamos usar para este servidor dos discos "Black", pasa que 
> de momento solo conseguimos uno).
>
> Les agradecería mucho cualquier comentario al respecto. Realmente no me doy 
> una idea de lo que puede estar pasando. Recuerdo haber rearmado RAID1 así de 
> esta forma (es decir que originalmente es de 500 pero al momento de 
> reemplazar el disco solo se consigue uno de 1 TB o más) y no he tenido ningún 
> problema...
>

>
> Como siempre, cualquier ayuda es bienvenida. Saludos y muchas gracias,
>
> Mauro.
>

un abrazo


-- 
Jorge A Secreto
Analista de Sistemas
MP 361