Re: aoe+mdadm crash

2012-01-09 bef zés Kiss Gabor

Kiss Gabor wrote:
 Az init scriptet egy Debian squeeze-ről hoztam át, ott szuperül
 működött. Része volt az aoetools csomagnak, viszont a RH vonalon
 hiányzik belőle.
 
 Redhaték vajon nem használnak AOE-t RAID-del együtt? A guglizás
 nem mutatja, hogy más is panaszkodna erre.

Óóó... A Debianon is én patcheltem bele a RAID támogatást.
Persze, hogy nincs hasonló a pirossapkás csomagokban. :-(

g
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: aoe+mdadm crash

2012-01-05 bef zés Gabor Gombas
On Wed, Jan 04, 2012 at 04:47:27PM +0100, Kiss Gabor wrote:

 Helyzet:
 
 CentOS 6. 6 darab AOE diszkből RAID5.
 Minden szuper, kivéve hogy nem lehet leállani a gépet.
 Az umount után kiadott madadm --stop /dev/md0 még lefut,
 de azt azonnal kernel pánik. Közli, hogy a memóriában
 megsérült a betöltött modulok láncolt listája.
 És ezután a halt/shutdown/reboot is elakad valahol végleg.
 
 A kernel 2.6.32-es.

In-kernel AoE modul, vagy a Coraid fele? Ha az elobbi, akkor probald ki
az utobbit; a Coraid nem igen tori magat, hogy a kernelben levo drivert
frissitse.

 Az sem segít, ha az mdmonitort már előbb leállítjuk.
 
 6 nagy file-on loop device-okkal összeraktunk egy másik RAID5-t,
 azt szét lehetett szedni baj nélkül.
 
 Az init scriptet egy Debian squeeze-ről hoztam át, ott szuperül
 működött. Része volt az aoetools csomagnak, viszont a RH vonalon
 hiányzik belőle.
 
 Redhaték vajon nem használnak AOE-t RAID-del együtt? A guglizás
 nem mutatja, hogy más is panaszkodna erre.

Hat, en inkabb az AoE ala tennem a RAID-et, nem fole. Mi adja a diszket?
Appliance vagy masik Linux?

Gabor
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


aoe+mdadm crash

2012-01-04 bef zés Kiss Gabor

Helyzet:

CentOS 6. 6 darab AOE diszkből RAID5.
Minden szuper, kivéve hogy nem lehet leállani a gépet.
Az umount után kiadott madadm --stop /dev/md0 még lefut,
de azt azonnal kernel pánik. Közli, hogy a memóriában
megsérült a betöltött modulok láncolt listája.
És ezután a halt/shutdown/reboot is elakad valahol végleg.

A kernel 2.6.32-es.

Az sem segít, ha az mdmonitort már előbb leállítjuk.

6 nagy file-on loop device-okkal összeraktunk egy másik RAID5-t,
azt szét lehetett szedni baj nélkül.

Az init scriptet egy Debian squeeze-ről hoztam át, ott szuperül
működött. Része volt az aoetools csomagnak, viszont a RH vonalon
hiányzik belőle.

Redhaték vajon nem használnak AOE-t RAID-del együtt? A guglizás
nem mutatja, hogy más is panaszkodna erre.

g
-- 
A mug of beer, please. Shaken, not stirred.
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm

2011-09-19 bef zés Kis János Tamás
A probléma megoldódott! :)

A hülye fejemmel elfelejtettem az update-initramfs -u parancsot
kiadni a tömbök kavarása után... így aztán a rendszer induláskor az
initrd.img-ben lévő mdadm.conf alapján próbálta meg összerakni a
tömböket, ami nem sikerült, mert volt némi eltérés az igazi
mdadm.conf-hoz képest...

Üdvözlettel:
kjt
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


mdadm

2011-09-16 bef zés Kis János Tamás
Sziasztok!

Van egy upgrade-re igencsak megérett etch, ahol a rendszer (/) egy
raid1 tömbön van, amihez biztos-ami biztos, 4 partíció tartozik
(pontosabban már csak tartozott).
Eredetileg a felállás ez volt:
/dev/md2 : /dev/hd[abc]2 + /dev/sd[ab]2 (a /dev/hdb2 volt a tartalék)

Gondoltam, előkészítem a squeeze telepítését és kiveszem a sata
lemezeket ebből a tömbből, hogy az azokból létrehozott másik tömbre
majd feltegyem a squeeze.-t.

Megjelöltem hát hibásnak a (/dev/sd[ab]2) partíciókat,
megvártam míg a szinkronizálás befejeződik,
kivettem a partíciókat,
lecsökkentettem a /dev/md2 eszközeinek számát 3-ra ( így az /dev/md2 :
/dev/hd[abc]2 maradt, tartalék nélkül ),
létrehoztam az új tömböt ( /dev/md12 : /dev/sd[ab]2 )
az /etc/mdadm/mdadm.conf-ot javítottam a mdadm --detail --scan
kimenete szerint
biztos ami biztos, futtattam egy grub-install-t (/dev/hd[abc]-re)
és megvártam, hogy újraindíthassam a gépet...

Nos, ez ma reggel meg is történt, de per pillanat én még a régi
rendszert akartam elindítani, ami viszont nem ment... mert a grub
megtalálja a menüt, a rendszer megpróbál indulni, de ez a süket etch
nem tudja összerakni a /dev/md2-t, azaz nincs /!
Kapok ugyan egy nagyon alap rendszert (initrd, vagy mi), ahol még
mdadm is van, de ott a mdadm --detail --scan is azt mondja, hogy nem
tudja összerakni a /dev/md2-t...
ha segítek neki, pl így mdadm -assemble -auto=yes -run /dev/md2
/dev/hd[abc]2 akkor összejön a dolog, csak éppen innen nem tudok
továbblépni sem megoldani azt, hogy induláskor se legyen probléma, sem
pedig felmenni init 3-as futásszintre

Arra is gondoltam, sebaj, majd rescue cd-vel megoldom... ami szépen,
minden külön mdadm-os trükközés nélkül fel is ismeri a /dev/md2-t, de
nem találtam hibát sehol, amit javíthatnék. (A szerver most úgy
üzemel, hogy a rescue cd-ről chroot-tal életre tudtam kelteni a
legfontosabb szolgáltatásokat...)

Volna esetleg valakinek ötlete, hogy hogy rakhatnám rendbe az indítási
folyamatot...?

Köszönettel:
kjt
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm

2011-09-16 bef zés Ferenc Wagner
Kis János Tamás kij...@gmail.com writes:

 nem tudja összerakni a /dev/md2-t, azaz nincs /!

A rendszer üzeneteit te sem olvastad, vagy csak előlünk titkolod?

 Kapok ugyan egy nagyon alap rendszert (initrd, vagy mi), ahol még
 mdadm is van, de ott a mdadm --detail --scan is azt mondja, hogy nem
 tudja összerakni a /dev/md2-t...

Nahát, ilyet nekem még sosem mondott!

 ha segítek neki, pl így mdadm -assemble -auto=yes -run /dev/md2
 /dev/hd[abc]2 akkor összejön a dolog, csak éppen innen nem tudok
 továbblépni

Hogyan próbáltad?  Ha van LVM is, akkor vgchange -ay, aztán exit.
-- 
Feri.
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Gyagya mdadm

2010-06-09 bef zés Hegedüs Ervin
Hello,

# cat /proc/mdstat | grep -A 2 md4 
md4 : active raid1 sda6[0] sdb6[2](F)
  4200896 blocks [2/1] [U_]
  
ennek ellenere:

# mdadm /dev/md4 --fail /dev/sdb6
mdadm: set /dev/sdb6 faulty in /dev/md4

es ehhez jon ez:

# mdadm /dev/md4 --remove /dev/sdb6
mdadm: hot remove failed for /dev/sdb6: Device or resource busy

A ps kimeneteben nehany masodpercenkent valtozo PID-del pedig ott
egy md4_resync processz.

Ilyenkor mit lehet csinalni?


a.

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: Gyagya mdadm

2010-06-09 bef zés Hegedüs Ervin
bocs,

2.6.31 Ubuntu szerver
mdadm - v2.6.7.1 - 15th October 2008

mdadm monitort leállítva a processz feléledése megszűnik, de a
partíciót továbbra sem lehet kivenni a tömbből és a syslog
folyamatosan logol:

RAID1 conf printout:
 --- wd:1 rd:2
 disk 0, wo:0, o:1, dev:sda6
 disk 1, wo:1, o:0, dev:sdb6
md: recovery of RAID array md4
md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
md: using maximum available idle IO bandwidth (but not more than 20 KB/sec) 
for recovery.
md: using 128k window, over a total of 4200896 blocks.
md: resuming recovery of md4 from checkpoint.
md: md4: recovery done.

de ezt mp-ként 10x.


köszi:


a.
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: Gyagya mdadm

2010-06-09 bef zés Andras HORVATH

Hegedüs Ervin airw...@freemail.hu wrote:
 # mdadm /dev/md4 --remove /dev/sdb6
 mdadm: hot remove failed for /dev/sdb6: Device or resource busy
 
 A ps kimeneteben nehany masodpercenkent valtozo PID-del pedig ott
 egy md4_resync processz.

tipp:

echo idle  /sys/block/md4/md/sync_action

?

Amugy milyen kernel ez?

raas
-- 
Those who say it cannot be done should not interrupt the person doing it.
   -- Chinese proverb

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: Gyagya mdadm

2010-06-09 bef zés Hegedüs Ervin
hello,

  # mdadm /dev/md4 --remove /dev/sdb6
  mdadm: hot remove failed for /dev/sdb6: Device or resource busy
  
  A ps kimeneteben nehany masodpercenkent valtozo PID-del pedig ott
  egy md4_resync processz.
 
 tipp:
 
 echo idle  /sys/block/md4/md/sync_action
 
 ?

heh :)

# cat /sys/block/md4/md/sync_action
recover
# echo idle  /sys/block/md4/md/sync_action
# cat /sys/block/md4/md/sync_action
recover
 
 Amugy milyen kernel ez?

2.6.31 Ubuntu szerver disztrib. kernel

Köszi,


a.
 
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: Gyagya mdadm

2010-06-09 bef zés Andras HORVATH

Hegedüs Ervin airw...@freemail.hu wrote:
 # cat /sys/block/md4/md/sync_action
 recover
 # echo idle  /sys/block/md4/md/sync_action
 # cat /sys/block/md4/md/sync_action
 recover

Ez bug, reportolja meg On. :-(

raas
-- 
Those who say it cannot be done should not interrupt the person doing it.
   -- Chinese proverb

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: Gyagya mdadm

2010-06-09 bef zés Hegedüs Ervin
hello,

  # cat /sys/block/md4/md/sync_action
  recover
  # echo idle  /sys/block/md4/md/sync_action
  # cat /sys/block/md4/md/sync_action
  recover
 
 Ez bug, reportolja meg On. :-(

gracie,

holnap diszkcsere és upgrade, ui nem a legfrissebb a kernel... :(


üdv:


a. 
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-05-10 bef zés Szima Gábor

On Sat, 1 May 2010, [utf-8] Hegedüs Ervin wrote:

 Mekkora is a vinyo (500GB)?
 Hol van a hiba helye... (500GB)?
 Veletlenul nem egy rossz particionalas, es tulfut az olvasas?

 és félévente 1x? Aztán másik diszknél 2 nap alatt 2x?

Mert elert egy bizonyos telitettseget, es elkezdte hasznalni azt a reszt 
is. Akkor szetesett, uj diszknel is hasznalgatta - az is.

Jartam mar igy (igaz nem raid, raadasul fat FS) gyarilag (gagyin) 
formazott K*ngst*n PEN drive-al.

De mint kiderult nem ez az ok, hatul MD superblock van.


-Sygma
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm raid10 szetesik

2010-05-09 bef zés Szima Gábor

On Sun, 2 May 2010, Gabor Gombas wrote:

 Mekkora is a vinyo (500GB)?
 Hol van a hiba helye... (500GB)?
 Veletlenul nem egy rossz particionalas, es tulfut az olvasas?

 Nem. Szimplan csak ott van az MD superblock.

Eddig abban a tudatban voltam, hogy az elejen van, de utananeztem: az 
utolso 1..12k-n talalhato.


-Sygma
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm raid10 szetesik

2010-05-06 bef zés Norbert Vastagh
Hegedüs Ervin airw...@freemail.hu írta (2010. május 1. 7:59):
 Tapot csereltel mar?

 nem, de az talan a leg problemasabb, mivel egy kb 10 eves HP
 ML350-esről van szo (G2-es talan...?)

Azért akár milyen jó minőségű táp, 10 év egy kapocslóüzemű, melegedő,
gondolom folyamatosan üzemelő elektronikának nagyon sok!!! Sőt, ott
már az alaplapon lévő tápegységekben is ugyanúgy biztos, hogy ki
vannak száradva az elektrolit kondenzátorok...

És egy nem stabil áramellátással üzemelő gép bármire képes ;-))

Érdemes lenne átkondizni az egészet, pár ezer forint anyag, és pár óra leállás.

Üdv:

-- 
Vastagh Norbert
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


SATA tapasztalat - volt: mdadm raid10 szetesik

2010-05-04 bef zés Hegedüs Ervin
hello,

tegnap kicsereltem az ominozus diszk SATA kabelet - egyelore
csend van.

Viszont az egyik restart utan ket masik diszkre a smart
badblock-ot jelez (más-más block-ra mondja).


A múltkori hibára többen írták a tápegység felelősségét - a
kérdésem hogy okozhat-e ilyet (kezdődő) táphiba (HP ML350 G3),
vagy csak simán kifogtunk egy szar SATA szériát (a négy eredeti
diszkből most cseréltem a másodikat, az egyik badblock-os diszk
már cserélve lett korábban)?

Bármilyen ötletet szívesen veszek,

Üdv:

a.

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-04 bef zés Zs
Hi!


 Hany diszkes raid10-bol?
 4,
 
 4 diszkesbol nem eshet ki ketto.
 miért?
 
 a fenti linken az ábra:
 
 The standard near layout
 
   4 drives
 --
 A1  A1  A2  A2
 A3  A3  A4  A4
 A5  A5  A6  A6
 A7  A7  A8  A8
 ..  ..  ..  ..
 
 most kiesett mondjuk a 3. diszkem. Az 1-es vagy 2-es diszkem
 miert nem eshet meg ki?
 
 más irányból megközelítve, lehet-e ilyet:
 mdadm /dev/md1 --create --level=raid10 --raid-devices=4 /dev/sda1 /dev/sdb1 
 missing missing
 
Kibicelek egy kicsit...

dd if=/dev/zero of=/tmp/image1.img bs=1M count=10
losetup /dev/loop0 /tmp/image1
Ezzel a módszerrel csinálsz még pár virtuális eszközt, majd
elkezdesz kisérletezni:
mdadm /dev/md1 --create --level=raid10 --raid-devices=4 /dev/loop0 /dev/loop1 
missing missing
Illetve ezt variálhatod, a vélt mirroroknak megfelelően:
mdadm /dev/md1 --create --level=raid10 --raid-devices=4 /dev/loop0 missing 
/dev/loop1 missing

Amikor a kisérletekkel megvagy és kiderül, hogy ez így működik-e,
akkor el lehet kezdeni kisérletezni azzal, hogy mit bír el a tömb,
ha kiveszel belől pár diszket. Ezt elsőként érdemes a virtuális
eszközökön létrehozott tömbbel lepróbálni, majd ha ott működik,
akkor garázdálkodni az élesen. Azt is fontos figyelembe venni,
hogy melyik eszköz a tömb hányadik eleme!

A valós tömb tesztelése:
- masina leáll
- 2 RAID winyó lehúz
- mdadm parancs, assemble művelet. Szigorúan READ-ONLY-ban indul
  a tömb, így ha bármi gond lenne, semmit nem fog módosítani,
  tehát leállás után a másik két winyó visszarakásával normálisan
  el kell indulnia a tömbnek.
- ha a tömb összerakható két winyóból READ-ONLY-ba, akkor azért
  azt mindenképpen ellenőrizném, hogy mindent jól lát-e a rendszer
- innen kezdve két lehetőség van: vagy nem rakható össze a tömb
  két winyóból csak háromból - vagy elindul két winyóval is.
  Ez utóbbi persze azt is jelenti, hogy erősen degradedben fut, ami
  nem igazán ideális állapot. Ha közben a winyók bad block hibákat
  is jeleznek, akkor degradedbe vinni a tömböt nem egy életbiztosítás!

Zsolt
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: SATA tapasztalat - volt: mdadm raid10 szetesik

2010-05-04 bef zés Szilard STANGE
Hali,

 vagy csak simán kifogtunk egy szar SATA szériát (a négy eredeti
 diszkből most cseréltem a másodikat, az egyik badblock-os diszk
 már cserélve lett korábban)?

Mi korábban Samsung 1 terás HDD-jéből fogtunk ki egy hibás szériát,
10-12 db volt, ha jól emlékszem végül az összeset visszaküldtük, tehát
ez is elképzelhető. Ráadásul volt olyan esemény is, hogy RAID5-ben két
diszk is pont ugyanazon a 64k adaton dobott szektorhibát...

Üdv
Szilárd


_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: SATA tapasztalat - volt: mdadm raid10 szetesik

2010-05-04 bef zés Hegedüs Ervin
hello,

  vagy csak simán kifogtunk egy szar SATA szériát (a négy eredeti
  diszkből most cseréltem a másodikat, az egyik badblock-os diszk
  már cserélve lett korábban)?
 
 Mi korábban Samsung 1 terás HDD-jéből fogtunk ki egy hibás szériát,
 10-12 db volt, ha jól emlékszem végül az összeset visszaküldtük, tehát
 ez is elképzelhető. Ráadásul volt olyan esemény is, hogy RAID5-ben két
 diszk is pont ugyanazon a 64k adaton dobott szektorhibát...

aha,

közben szétszedtem a raid10-et és csináltam egy raid1-et, első
körben egy diszkkel. Másoláskor az utoljára berakott diszkre
megint dobott néhány hibát a smart, szal' nem igazán megnyugtató
(két diszk most üresben megy)


Köszi:


a. 
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Hegedüs Ervin
hello,

hogy lehet kideríteni, hogy egy 4 tagú raid10-ben melyik diszkek
vannak tükrözve (párban)?

man md, mdadm nem volt ezen a téren bőbeszédű...


Köszönöm:


a.
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Gabor HALASZ
On 2010.05.03. 9:37, Hegedüs Ervin wrote:
 hello,

 hogy lehet kideríteni, hogy egy 4 tagú raid10-ben melyik diszkek
 vannak tükrözve (párban)?

/proc/mdstat?

-- 
Gabor HALASZ halas...@freemail.hu
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Hegedüs Ervin
hello,

  hogy lehet kideríteni, hogy egy 4 tagú raid10-ben melyik diszkek
  vannak tükrözve (párban)?
 
 /proc/mdstat?

köszi, konkrétabban?

Personalities : [raid1] [raid10] 
md0 : active raid10 sdc1[1] sdd1[0] sda1[3] sdb1[2]
  976767872 blocks 64K chunks 2 near-copies [4/4] []

tehát kérdés másképp: hogy kell értelmezni a fenti kimenetet?

az sdc és az sdd, valamint az sda/sdb vannak raid1-ben? 


köszi:


a.

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Gabor HALASZ
On 2010.05.03. 10:56, Hegedüs Ervin wrote:
 hello,

 hogy lehet kideríteni, hogy egy 4 tagú raid10-ben melyik diszkek
 vannak tükrözve (párban)?

 /proc/mdstat?

 köszi, konkrétabban?


konkretan fogalmam sincs.

 Personalities : [raid1] [raid10]
 md0 : active raid10 sdc1[1] sdd1[0] sda1[3] sdb1[2]
976767872 blocks 64K chunks 2 near-copies [4/4] []

 tehát kérdés másképp: hogy kell értelmezni a fenti kimenetet?

En ugy ertelmezem, hogy villamgyors migracio szukseges valami kevesbe 
atgondolatlanul implementalt raid levelre.


 az sdc és az sdd, valamint az sda/sdb vannak raid1-ben?


Barhogyan lehet. Esetleg a boot uzenetek kozott lehet valami tampont, 
nezd meg a dmesget.

-- 
Gabor HALASZ halas...@freemail.hu
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Hegedüs Ervin
hello,

  /proc/mdstat?
 
  köszi, konkrétabban?
 
 
 konkretan fogalmam sincs.

ez volt a kérdés lényege.
 
  Personalities : [raid1] [raid10]
  md0 : active raid10 sdc1[1] sdd1[0] sda1[3] sdb1[2]
 976767872 blocks 64K chunks 2 near-copies [4/4] []
 
  tehát kérdés másképp: hogy kell értelmezni a fenti kimenetet?
 
 En ugy ertelmezem, hogy villamgyors migracio szukseges valami kevesbe 
 atgondolatlanul implementalt raid levelre.

úgymint?

Linux eseten van mas softraid implementacio?
Mas rendszereknel kivaloan (ertsd: altalad nem kritizalhato
modon) mukodik ez a komponens?
(esetleg egy raid10 eseten ilyet ki lehet deriteni mashol?)
 
  az sdc és az sdd, valamint az sda/sdb vannak raid1-ben?
 
 
 Barhogyan lehet. Esetleg a boot uzenetek kozott lehet valami tampont, 
 nezd meg a dmesget.

semmi eredmeny.


koszi:


a.
 
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Papp Tamas
On Mon, May 03, 2010 at 11:19:13AM +0200, Hegedüs Ervin wrote:
 
 úgymint?
 
 Linux eseten van mas softraid implementacio?
 Mas rendszereknel kivaloan (ertsd: altalad nem kritizalhato
 modon) mukodik ez a komponens?
 (esetleg egy raid10 eseten ilyet ki lehet deriteni mashol?)

O ugyis irni fog egy feloldalt, amiben fikazza a linux-ot.

Viszont ha te hozod letre a raid10-et raid tombokbol, az elvileg jo
lesz neked, nem?

Udv,

tamas

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés /dev/null
Szia!

(man mdadm, de ugye ez nem kezdő lista)

2010-05-03 10:56 keltezéssel, Hegedüs Ervin írta:

 Personalities : [raid1] [raid10]
 md0 : active raid10 sdc1[1] sdd1[0] sda1[3] sdb1[2]
976767872 blocks 64K chunks 2 near-copies [4/4] []

 tehát kérdés másképp: hogy kell értelmezni a fenti kimenetet?

 az sdc és az sdd, valamint az sda/sdb vannak raid1-ben?


md0 : active raid10 sdc1[1] sdd1[0] sda1[3] sdb1[2] - a tömbben lakó 
diskek és azok particiói és a tömbben elfoglalt helyük.

fdisk -l megmondja mi van még a disken.

sdc1[1] sdc 1-es particioja a raid tömb 2-es diskje. a többi értelemszrüen.

976767872 blocks ennyi blokk, 64k-s foglalási egységek
[4/4] 4-ből 4 disk van a tömbben ami aktív is
[] 4 disk Up

ha [UU U], -vagy [UUU_U] már nem tudom pontosan- lenne akkor a 3. disk Fail, 
vagyis a fenti konfigból kiindulva sda1[3] lenne a hibás eszköz.

a syslogban találsz róla bővebben ilyen esetben, illetve a cat 
/proc/mdstat és az mdadm --detail /dev/md0

nálam ez így fest:

/dev/md0:
 Version : 0.90
   Creation Time : Sat Apr 25 17:35:38 2009
  Raid Level : raid1
  Array Size : 47849472 (45.63 GiB 49.00 GB)
   Used Dev Size : 47849472 (45.63 GiB 49.00 GB)
Raid Devices : 2
   Total Devices : 2
Preferred Minor : 0
 Persistence : Superblock is persistent

 Update Time : Mon May  3 11:16:33 2010
   State : clean
  Active Devices : 2
Working Devices : 2
  Failed Devices : 0
   Spare Devices : 0

UUID : 715b0e15:da42cf7e:d0353f58:a8e68309
  Events : 0.2008333

 Number   Major   Minor   RaidDevice State
0   810  active sync   /dev/sda1
1   8   171  active sync   /dev/sdb1

de ez csak egy sima tükör.

husy

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Hegedüs Ervin
  úgymint?
  
  Linux eseten van mas softraid implementacio?
  Mas rendszereknel kivaloan (ertsd: altalad nem kritizalhato
  modon) mukodik ez a komponens?
  (esetleg egy raid10 eseten ilyet ki lehet deriteni mashol?)
 
 O ugyis irni fog egy feloldalt, amiben fikazza a linux-ot.

tegye, igazan nem erdekel. Ami erdekelne, hogy pl mondjon mast
amivel lehet helyettesiteni, tudja azokat amiket a Linux mar tud
- beleertve a 3rd-party alkalmazasok tamogatasa: virusirtok,
adatbazis-kezelok, es tok felesleges sorolni.

 Viszont ha te hozod letre a raid10-et raid tombokbol, az elvileg jo
 lesz neked, nem?

elvileg. ill jo volt eddig, megvolt az oka h miert raid10 volt,
de vegul senkinek nem kellett aki korabban igenyelte.

Szet akarom bontani ezt a raid10-et, es inkabb ket raid1 lesz.
Megoldhato mas modon is (backup-restore), de erdekel hogy lehet-e
ilyet, pusztan kivancsisagbol.


a.
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Gabor HALASZ
On 2010.05.03. 11:19, Hegedüs Ervin wrote:
 hello,

 /proc/mdstat?

 köszi, konkrétabban?


 konkretan fogalmam sincs.

 ez volt a kérdés lényege.


Mivel nincs raid10-em, te meg nem irtad, mit csinaltal...

 Personalities : [raid1] [raid10]
 md0 : active raid10 sdc1[1] sdd1[0] sda1[3] sdb1[2]
 976767872 blocks 64K chunks 2 near-copies [4/4] []

 tehát kérdés másképp: hogy kell értelmezni a fenti kimenetet?

 En ugy ertelmezem, hogy villamgyors migracio szukseges valami kevesbe
 atgondolatlanul implementalt raid levelre.

 úgymint?

 Linux eseten van mas softraid implementacio?

raid1+0, 4 diszk es near layout eseten pont ugyanazt csinalja.

 Mas rendszereknel kivaloan (ertsd: altalad nem kritizalhato
 modon) mukodik ez a komponens?

Nem igazan arrol van szo, hogy en mit kritizalok vagy mit nem. Kozben 
kupaltam magam helyetted (de minek, amikor en nem hasznalok linuxot, te 
meg itt hozongsz :), es arra jutottam, hogy nem veletlenul nem tudja 
kiirni, ugyanis sok esetben nem ertelmezheto, pl 3 diszkes raid10 eseten.

 (esetleg egy raid10 eseten ilyet ki lehet deriteni mashol?)

Nem, a raid10 ritka, az md-ben levo raid10 implementacio meg el is ter tole.

-- 
Gabor HALASZ halas...@freemail.hu
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Hegedüs Ervin
hello,

  /proc/mdstat?
 
  köszi, konkrétabban?
 
 
  konkretan fogalmam sincs.
 
  ez volt a kérdés lényege.
 
 
 Mivel nincs raid10-em, te meg nem irtad, mit csinaltal...

egyrészt jogos hogy nem irtam mit csinaltam, de ez nem is a
kerdesre volt valasz - mindegy.

  Personalities : [raid1] [raid10]
  md0 : active raid10 sdc1[1] sdd1[0] sda1[3] sdb1[2]
  976767872 blocks 64K chunks 2 near-copies [4/4] []
 
  tehát kérdés másképp: hogy kell értelmezni a fenti kimenetet?
 
  En ugy ertelmezem, hogy villamgyors migracio szukseges valami kevesbe
  atgondolatlanul implementalt raid levelre.
 
  úgymint?
 
  Linux eseten van mas softraid implementacio?
 
 raid1+0, 4 diszk es near layout eseten pont ugyanazt csinalja.

es jelez ha kiesik a diszk, tudod ugyanugy managelni, stb...?
(csak kerdem, meg nem csinaltam ilyet)
 
  Mas rendszereknel kivaloan (ertsd: altalad nem kritizalhato
  modon) mukodik ez a komponens?
 
 Nem igazan arrol van szo, hogy en mit kritizalok vagy mit nem. Kozben 
 kupaltam magam helyetted (de minek, amikor en nem hasznalok linuxot, te 
 meg itt hozongsz :),

szerintem nem hozongok, egyaltalan nem volt semmi olyan
hozzaszolasom amit hozogneskent kellett volna ertekelned, sorry
ha így értetted.

nem varom el senkitol h helyettem kupalja magat, ha tudja a
kerdesre a valaszt, akkor irja le, ha nem tudja de erdekli, akkor
meg ne irjon ilyeneket...

 es arra jutottam, hogy nem veletlenul nem tudja 
 kiirni, ugyanis sok esetben nem ertelmezheto, pl 3 diszkes raid10 eseten.

3 diszkes raid 10?
ezt kifejtened? marmint h miert nem lehet ertelmezni? ha 3
diszkbol epitesz valahogy raid10-et, akkor is lesznek tukrozott
parok...

  (esetleg egy raid10 eseten ilyet ki lehet deriteni mashol?)
 
 Nem, a raid10 ritka, az md-ben levo raid10 implementacio meg el is ter tole.
mitol ter el? ket modon lehet a koztudatban jelen levo
raid10-et implementalni: raid1+0 vagy raid0+1.

Mindket esetben lehet ertelmezni a tukroket IMHO.


a.
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Hegedüs Ervin
hello,

 (man mdadm, de ugye ez nem kezdő lista)
 
[sok feleslegeset :)]
 
 de ez csak egy sima tükör.

de nekem meg raid10 kellene... ill azon belul a tukrok
szervezese.

koszonom a segito szandekot, hidd el mar mindegyiken tul vagyok
:)



a.
 
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Gábriel Ákos
On Mon, 2010-05-03 at 10:56 +0200, Hegedüs Ervin wrote:
 hello,
 
   hogy lehet kideríteni, hogy egy 4 tagú raid10-ben melyik diszkek
   vannak tükrözve (párban)?
  
  /proc/mdstat?
 
 köszi, konkrétabban?
 
 Personalities : [raid1] [raid10] 
 md0 : active raid10 sdc1[1] sdd1[0] sda1[3] sdb1[2]
   976767872 blocks 64K chunks 2 near-copies [4/4] []
 
 tehát kérdés másképp: hogy kell értelmezni a fenti kimenetet?
 
 az sdc és az sdd, valamint az sda/sdb vannak raid1-ben? 
 

Nem. A RAID10 itt blokkonként értelmezendő. Ha csinálsz egy RAID1-et
majd arra egy 0-t, vagy fordítva, akkor tehető fel a kérdésed, de akkor
egyértelmű rá a válasz is.

A pontos válasz a kérdésedre:

http://en.wikipedia.org/wiki/Non-standard_RAID_levels#Linux_MD_RAID_10



-- 
Üdvözlettel,
Gábriel Ákos
-=E-Mail :akos.gabr...@i-logic.hu|Web:  http://www.i-logic.hu=-
-=Tel/fax:+3612391618|Mobil:+36209278894 =-

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Gabor HALASZ
On 2010.05.03. 12:18, Hegedüs Ervin wrote:


 Linux eseten van mas softraid implementacio?

 raid1+0, 4 diszk es near layout eseten pont ugyanazt csinalja.

 es jelez ha kiesik a diszk, tudod ugyanugy managelni, stb...?
 (csak kerdem, meg nem csinaltam ilyet)


Nem tudom, nem hasznalok md-t. Ha jol olvastam az md-t, a 4 diszkes near 
layout-os raid10 pont raid1+0, mert

a1 a1 a2 a2
a3 a3 a4 a4
...

sorrendben hasznalja a diszkeket.


 nem varom el senkitol h helyettem kupalja magat, ha tudja a
 kerdesre a valaszt, akkor irja le, ha nem tudja de erdekli, akkor
 meg ne irjon ilyeneket...


Milyeneket?

 es arra jutottam, hogy nem veletlenul nem tudja
 kiirni, ugyanis sok esetben nem ertelmezheto, pl 3 diszkes raid10 eseten.

 3 diszkes raid 10?
 ezt kifejtened? marmint h miert nem lehet ertelmezni? ha 3
 diszkbol epitesz valahogy raid10-et, akkor is lesznek tukrozott
 parok...

Igen, de nem tudod szetszedni, mert a kovetkezo szerint ir:

a1 a1 a2
a2 a3 a3
a4 a4 a5
...


 (esetleg egy raid10 eseten ilyet ki lehet deriteni mashol?)

 Nem, a raid10 ritka, az md-ben levo raid10 implementacio meg el is ter tole.
 mitol ter el? ket modon lehet a koztudatban jelen levo
 raid10-et implementalni: raid1+0 vagy raid0+1.

A linuxos md a nem koztudatban levo raid leveleket valosit meg, un AHS 
algoritmus szerint (ennel mondjuk determinisztikusabb, de a userek nem 
gondolkodnak, szamukra leginkabb az ahogy sikerult). Nagyjabol raid1, 
raid1e, raid1+0 near-t csinal, a diszkek szamanak fuggvenyeben, de meg 
lehet a layout-tal is vagy egyebbekkel is kavarni.


 Mindket esetben lehet ertelmezni a tukroket IMHO.


Ellenben van meg jopar, amikor nem.

-- 
Gabor HALASZ halas...@freemail.hu
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Hegedüs Ervin
hello,

  az sdc és az sdd, valamint az sda/sdb vannak raid1-ben? 
  
 
 Nem. A RAID10 itt blokkonként értelmezendő. Ha csinálsz egy RAID1-et
 majd arra egy 0-t, vagy fordítva, akkor tehető fel a kérdésed, de akkor
 egyértelmű rá a válasz is.
 
 A pontos válasz a kérdésedre:
 
 http://en.wikipedia.org/wiki/Non-standard_RAID_levels#Linux_MD_RAID_10

oh, koszonom, ez uj volt, viszont igy (majd) minden tiszta.

viszont tovabbra is kerdes, hogy melyik ket diszk eshet ki
egyszerre? near-copy van, a leiras eleg ertheto, de ugy erzem a
kerdes jogos.


Koszonom:


a.


_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Hegedüs Ervin
hello,

 Nem tudom, nem hasznalok md-t. Ha jol olvastam az md-t, a 4 diszkes near 
 layout-os raid10 pont raid1+0, mert
 
 a1 a1 a2 a2
 a3 a3 a4 a4
 ...
 
 sorrendben hasznalja a diszkeket.

kozben kaptam linket, utanaolvastam, koszi,
 
  nem varom el senkitol h helyettem kupalja magat, ha tudja a
  kerdesre a valaszt, akkor irja le, ha nem tudja de erdekli, akkor
  meg ne irjon ilyeneket...
 
 
 Milyeneket?

Kozben kupaltam magam helyetted (de minek, amikor en nem hasznalok
linuxot, te meg itt hozongsz :)

  3 diszkes raid 10?
  ezt kifejtened? marmint h miert nem lehet ertelmezni? ha 3
  diszkbol epitesz valahogy raid10-et, akkor is lesznek tukrozott
  parok...
 
 Igen, de nem tudod szetszedni, mert a kovetkezo szerint ir:
 
 a1 a1 a2
 a2 a3 a3
 a4 a4 a5
 ...

ez is tisztult, koszi,


udv:


a. 
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Gábriel Ákos
On Mon, 2010-05-03 at 13:02 +0200, Hegedüs Ervin wrote:
 hello,
 
   az sdc és az sdd, valamint az sda/sdb vannak raid1-ben? 
   
  
  Nem. A RAID10 itt blokkonként értelmezendő. Ha csinálsz egy RAID1-et
  majd arra egy 0-t, vagy fordítva, akkor tehető fel a kérdésed, de akkor
  egyértelmű rá a válasz is.
  
  A pontos válasz a kérdésedre:
  
  http://en.wikipedia.org/wiki/Non-standard_RAID_levels#Linux_MD_RAID_10
 
 oh, koszonom, ez uj volt, viszont igy (majd) minden tiszta.
 
 viszont tovabbra is kerdes, hogy melyik ket diszk eshet ki
 egyszerre? near-copy van, a leiras eleg ertheto, de ugy erzem a
 kerdes jogos.

Hany diszkes raid10-bol?
4 diszkesbol nem eshet ki ketto.


-- 
Üdvözlettel,
Gábriel Ákos
-=E-Mail :akos.gabr...@i-logic.hu|Web:  http://www.i-logic.hu=-
-=Tel/fax:+3612391618|Mobil:+36209278894 =-

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Hegedüs Ervin
hello,

   Nem. A RAID10 itt blokkonként értelmezendő. Ha csinálsz egy RAID1-et
   majd arra egy 0-t, vagy fordítva, akkor tehető fel a kérdésed, de akkor
   egyértelmű rá a válasz is.
   
   A pontos válasz a kérdésedre:
   
   http://en.wikipedia.org/wiki/Non-standard_RAID_levels#Linux_MD_RAID_10
  
  oh, koszonom, ez uj volt, viszont igy (majd) minden tiszta.
  
  viszont tovabbra is kerdes, hogy melyik ket diszk eshet ki
  egyszerre? near-copy van, a leiras eleg ertheto, de ugy erzem a
  kerdes jogos.
 
 Hany diszkes raid10-bol?
4,

 4 diszkesbol nem eshet ki ketto.
miért?

a fenti linken az ábra:

The standard near layout

  4 drives
--
A1  A1  A2  A2
A3  A3  A4  A4
A5  A5  A6  A6
A7  A7  A8  A8
..  ..  ..  ..

most kiesett mondjuk a 3. diszkem. Az 1-es vagy 2-es diszkem
miert nem eshet meg ki?

más irányból megközelítve, lehet-e ilyet:
mdadm /dev/md1 --create --level=raid10 --raid-devices=4 /dev/sda1 /dev/sdb1 
missing missing

?



a.

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Gabor Gombas
On Mon, May 03, 2010 at 01:44:55PM +0200, Hegedüs Ervin wrote:

 más irányból megközelítve, lehet-e ilyet:
 mdadm /dev/md1 --create --level=raid10 --raid-devices=4 /dev/sda1 /dev/sdb1 
 missing missing

Ilyent eppen nem, az elso 2-bol ill. a masodik 2-bol is legfeljebb 1
lehet missing. Pl. /dev/sda1 missing /dev/sdb1 missing mar jo.

Gabor
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm raid10 szetesik

2010-05-03 bef zés Gabor Gombas
On Sun, May 02, 2010 at 12:33:07AM +0200, Hegedüs Ervin wrote:

  - SMART-ot hasznalsz, es a diszk firmware, vagy magat intelligensnek
gondolo vezerlo eseten a vezerlo firmware bugos. Ne hasznalj SMART-ot.
 
 ez megved a tomb szetesesetol? egyebkent majdnem ua a diszk, de
 nem az a szeria, valszeg mas firmware van mint a masik 3 diszken.

Ha tenyleg ez okozza, akkor igen. Konnyu ellenorizni, kapcsolj ki minden
SMART-ot hasznalo cuccot (smartd, hddtemp, esetleges egyeb monitorozo
cuccok), es nezd meg, meddig marad eletben.

 ahogy irtam, a gep kb 1.5 eve megy, alapertelmezetten nem kicsi -
 az viszont lehet h kezdi megadni magat. (elotte is ment, de nem
 ennyi diszkkel)

A nem ennyi diszkkel egy fontos reszlet...

Gabor
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: raid10 szervezes - volt: mdadm raid10 szetesik

2010-05-03 bef zés Hegedüs Ervin
hello,

  más irányból megközelítve, lehet-e ilyet:
  mdadm /dev/md1 --create --level=raid10 --raid-devices=4 /dev/sda1 /dev/sdb1 
  missing missing
 
 Ilyent eppen nem, az elso 2-bol ill. a masodik 2-bol is legfeljebb 1
 lehet missing. Pl. /dev/sda1 missing /dev/sdb1 missing mar jo.

ezek szerint az eszkozok sorrendje meghatarozza a szervezest?
Tehat 4 diszk eseten az elso es a masodik van tukrozve, ill a
harmadik es a negyedik?

Ha ez igaz, akkor az sdc (3. diszk) kiesese eseten az sda/sdb
kozul egy meg kieshet?


Koszonom:


a.

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-05-01 bef zés Hegedüs Ervin
hello,

 Nem tudom, mit akarsz jarkalni akorul, hogy nem adja vissza a hibakodot.

mivel azt nem tudom korbejarni, evidens h nem azt - pont emiatt
lenne jo behatarolni a hibat...
 
  [34844995.336207] ata3.00: exception Emask 0x10 SAct 0x0 SErr 0x8
  action 0xe frozen
 
 Itt van hibakod, ezt a kernelforras segitsegevel el lehet olvasni. Az
 almoskonyv:
 
 https://ata.wiki.kernel.org/index.php/Libata_error_messages

koszi, ezen meg ragodom... igazabol ez csak szamarvezeto
onmagaban, mindenkepp kell forrast is turni, legalabbis en nem
latok sok reszletes infot benne.
 
  ps: visszanézve a hibaüzeneteket az azért gyanús, hogy mindkét
  diszknél ugyanarra a szektorra rinyál... :)
  976768065 szektorból áll a diszk...
 
 Az a baj, hogy az md is piszkalja a smart-ot, szoval van lehetoseg magiara
 gazdagon. 

nna, jobbnal jobb hirek.

 Tapot csereltel mar?

nem, de az talan a leg problemasabb, mivel egy kb 10 eves HP
ML350-esről van szo (G2-es talan...?)

 Mielott fekete kakast aldozol kretakor
 kozepen, probald meg
 esetleg a sil kartya firmwaret frissiteni.

(sohaj...)

Elotte egy kabelcseret megprobalok, egyreszt olcsobb/egyszerubb,
masreszt a firmware ha eddig mukodott igy, valszeg elmegy meg egy
ideig. SATA kabelbol meg inkabb kinezem hogy meg akar allasaban
is tonkremegy.

=%=


a teljesseg kedveert ma meg megorvendeztetett egy ujabb
uzenettel:

[137106.138764] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[137106.138810] ata3.00: cmd b0/d0:01:00:4f:c2/00:00:00:00:00/00 tag 0 pio 512 
in
[137106.138812]  res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 
(timeout)
[137106.138904] ata3.00: status: { DRDY }
[137106.138938] ata3: hard resetting link
[137108.785505] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 0)
[137108.793469] ata3.00: configured for UDMA/100
[137108.793469] ata3: EH complete
[137108.793469] sd 4:0:0:0: [sdc] 976773168 512-byte hardware sectors (500108 
MB)
[137108.805227] sd 4:0:0:0: [sdc] Write Protect is off
[137108.805227] sd 4:0:0:0: [sdc] Mode Sense: 00 3a 00 00
[137108.805227] sd 4:0:0:0: [sdc] Write cache: enabled, read cache: enabled, 
doesn't support DPO or FUA

bar hibakod itt sincs, sikerult lekezelni a hibat, es a raid sem
esett szet.



a.

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-05-01 bef zés Szima Gábor

On Fri, 30 Apr 2010, [UTF-8] Kónya Zoltán (EVM) wrote:

 A két nappal ezelőtti üzenet ez volt:
 ...
 .

 [34845002.313723] end_request: I/O error, dev sdc, sector 976767935

 a mostani meg ez?
 [86349.425488] end_request: I/O error, dev sdc, sector 976767935
 ha jól látom ugyanarra a HW sectorra hivatkozik a két különböző disk esetén!?

Mekkora is a vinyo (500GB)?
Hol van a hiba helye... (500GB)?
Veletlenul nem egy rossz particionalas, es tulfut az olvasas?

 lehet, hogy elnéztem, ha nem, akkor inkább kernel bug lehet!?

Vagy fdisk. ;)


-Sygma
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm raid10 szetesik

2010-05-01 bef zés Hegedüs Ervin
hello,

  [34845002.313723] end_request: I/O error, dev sdc, sector 976767935
 
  a mostani meg ez?
  [86349.425488] end_request: I/O error, dev sdc, sector 976767935
  ha jól látom ugyanarra a HW sectorra hivatkozik a két különböző disk 
  esetén!?
 
 Mekkora is a vinyo (500GB)?
 Hol van a hiba helye... (500GB)?
 Veletlenul nem egy rossz particionalas, es tulfut az olvasas?

és félévente 1x? Aztán másik diszknél 2 nap alatt 2x?
 
  lehet, hogy elnéztem, ha nem, akkor inkább kernel bug lehet!?
 
 Vagy fdisk. ;)

vagy a műszaki boltból valaki... :)


a.
 
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-05-01 bef zés Gabor Gombas
On Sat, May 01, 2010 at 11:16:58AM +0200, Szima Gábor wrote:
 
 On Fri, 30 Apr 2010, [UTF-8] Kónya Zoltán (EVM) wrote:
 
  A két nappal ezelőtti üzenet ez volt:
  ...
  .
 
  [34845002.313723] end_request: I/O error, dev sdc, sector 976767935
 
  a mostani meg ez?
  [86349.425488] end_request: I/O error, dev sdc, sector 976767935
  ha jól látom ugyanarra a HW sectorra hivatkozik a két különböző disk 
  esetén!?
 
 Mekkora is a vinyo (500GB)?
 Hol van a hiba helye... (500GB)?
 Veletlenul nem egy rossz particionalas, es tulfut az olvasas?

Nem. Szimplan csak ott van az MD superblock. Amit szinkron ir, azaz kap
a drive egy FLUSH parancsot. Tehat ha a drive a FLUSH-t nem birja, akkor
ez nagy valoszinuseggel ugy fog megnyilvanulni, hogy az MD superblock
irasakor lesz hiba, es szetesik a tomb.

Hogy miert nem birja a diszk a FLUSH-t, annak sok oka lehet:

- Mediahibat akar javitani, de tul sokaig tart neki. Hasznalj SMART-ot.

- SMART-ot hasznalsz, es a diszk firmware, vagy magat intelligensnek
  gondolo vezerlo eseten a vezerlo firmware bugos. Ne hasznalj SMART-ot.

- A tap kicsi vagy kezdi megadni magat. A RAID superblock update miatt
  az osszes diszk egyszerre akar seek-elni (jo nagyot, mert a superblock
  hatul van) es kinyomni tobb MB cache tartalmat, ami egy szep tusket
  jelent az energia-fogyasztasban. Ha a tap ezt nem kepes kiszolgalni,
  es valamelyik diszk kevesbe birja a nominalisnal kisebb feszultseget,
  akkor mindenfele erdekes es nehezen ertelmezheto hibak jonnek elo.

Gabor
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm raid10 szetesik

2010-05-01 bef zés Hegedüs Ervin
hello,

   [86349.425488] end_request: I/O error, dev sdc, sector 976767935
   ha jól látom ugyanarra a HW sectorra hivatkozik a két különböző disk 
   esetén!?
  
  Mekkora is a vinyo (500GB)?
  Hol van a hiba helye... (500GB)?
  Veletlenul nem egy rossz particionalas, es tulfut az olvasas?
 
 Nem. Szimplan csak ott van az MD superblock. Amit szinkron ir, azaz kap
 a drive egy FLUSH parancsot. Tehat ha a drive a FLUSH-t nem birja, akkor
 ez nagy valoszinuseggel ugy fog megnyilvanulni, hogy az MD superblock
 irasakor lesz hiba, es szetesik a tomb.

eddig ez a legelfogadhatobb magyarazat :)

 Hogy miert nem birja a diszk a FLUSH-t, annak sok oka lehet:
 
 - Mediahibat akar javitani, de tul sokaig tart neki. Hasznalj SMART-ot.
hasznalok SMART-ot,
 
 - SMART-ot hasznalsz, es a diszk firmware, vagy magat intelligensnek
   gondolo vezerlo eseten a vezerlo firmware bugos. Ne hasznalj SMART-ot.

ez megved a tomb szetesesetol? egyebkent majdnem ua a diszk, de
nem az a szeria, valszeg mas firmware van mint a masik 3 diszken.
 
 - A tap kicsi vagy kezdi megadni magat. A RAID superblock update miatt
   az osszes diszk egyszerre akar seek-elni (jo nagyot, mert a superblock
   hatul van) es kinyomni tobb MB cache tartalmat, ami egy szep tusket
   jelent az energia-fogyasztasban. Ha a tap ezt nem kepes kiszolgalni,
   es valamelyik diszk kevesbe birja a nominalisnal kisebb feszultseget,
   akkor mindenfele erdekes es nehezen ertelmezheto hibak jonnek elo.

ahogy irtam, a gep kb 1.5 eve megy, alapertelmezetten nem kicsi -
az viszont lehet h kezdi megadni magat. (elotte is ment, de nem
ennyi diszkkel)

A ket napja kiszedett diszket ma teszteltem itthon, eleg stabilan
rossz, de csak a SMART ad hibat, ill a csere elott meg produkalt
egy megallast, mikozben epp irtam ra, ezert inditottam egy
fsck-t, az eleg fura uzeneteket generalt (marmint dmesg-ben, a
diszkre).

A bonnie siman fut, masolni-hasznalni amugy lehet.


Koszonom:


a.
 
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

mdadm raid10 szetesik

2010-04-30 bef zés Hegedüs Ervin
Hello,

Debian Lenny, up-to-date rendszer, softraid10.
Két napja kiesett egy diszk, vissza tudtam építeni, de
kicseréltem a diszket, ezzel korábban is volt már gond.
Most a tegnapi friss diszk ismét kiesett...

A tegnap kiszedett diszket nem tudtam még máshol kipróbálni, hogy
valóban rossz-e (szektorhiba, ...), vagy a kártya szarakodik, ami
egy Silicon Image, Inc. SiI 3124 PCI-X SATA controller.

A tegnap betett diszk típusra (majdnem) ua: SAMSUNG HD502IJ a
régi széria, ez pedig SAMSUNG HD501LJ.


Kártyát nézzek vagy ismét diszket?



köszi:


a.
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Hegedüs Ervin
hello,

 Debian Lenny, up-to-date rendszer, softraid10.
 Két napja kiesett egy diszk, vissza tudtam építeni, de
 kicseréltem a diszket, ezzel korábban is volt már gond.
 Most a tegnapi friss diszk ismét kiesett...

visszanézve a történeteket még annyi adalék, hogy sok nagyméretű
filet és könyvtárat töröltem ípp', mikor a raid szétesett.

Van valakinek tapasztalata raid10 nagy I/O ilyen jellegű
(negatív) tapasztalata?


Köszönöm:

a.
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Hofferek Attila
Hegedüs Ervin írta:
 hello,
 
 Debian Lenny, up-to-date rendszer, softraid10.
 Két napja kiesett egy diszk, vissza tudtam építeni, de
 kicseréltem a diszket, ezzel korábban is volt már gond.
 Most a tegnapi friss diszk ismét kiesett...
 
 visszanézve a történeteket még annyi adalék, hogy sok nagyméretű
 filet és könyvtárat töröltem ípp', mikor a raid szétesett.

Hello,
file torles szempontjabol van jelentosege, hogy mekkora volt az a file? 
Milyen fajlrendszer volt vagy van a disken?
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Hegedüs Ervin
hello,

  Debian Lenny, up-to-date rendszer, softraid10.
  Két napja kiesett egy diszk, vissza tudtam építeni, de
  kicseréltem a diszket, ezzel korábban is volt már gond.
  Most a tegnapi friss diszk ismét kiesett...
  
  visszanézve a történeteket még annyi adalék, hogy sok nagyméretű
  filet és könyvtárat töröltem ípp', mikor a raid szétesett.
 
 file torles szempontjabol van jelentosege, hogy mekkora volt az a file? 
nem tudom, változó méretek voltak: volt néhány GB-os file de
voltak 5-8 MB-osak is. A egyik könyvtár törlésénél fura volt, h
sokáig molyol a rendszer, abban spec 5-8MB-os fileok voltak.

 Milyen fajlrendszer volt vagy van a disken?
ext3 (LVM-en), de ez miért determinál?

én még arra gondoltam, hogy nem egyforma a diszk, mondjuk ez az
új valamivel lassabb (vagy gyorsabb) és a raid azt mondja
valamelyik művelet után hogy ez nem tetszik neki.

Ezzel az üzenettel dobta ki a tömbből:

[86346.945481] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[86346.945510] ata3.00: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 0
[86346.945512]  res 40/00:00:09:4f:c2/00:00:00:00:00/00 Emask 0x4 
(timeout)
[86346.945545] ata3.00: status: { DRDY }
[86346.945564] ata3: hard resetting link
[86349.393520] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 0)
[86349.411207] ata3.00: configured for UDMA/100
[86349.411207] ata3: EH complete
[86349.411207] sd 4:0:0:0: [sdc] 976773168 512-byte hardware sectors (500108 MB)
[86349.411207] sd 4:0:0:0: [sdc] Write Protect is off
[86349.411207] sd 4:0:0:0: [sdc] Mode Sense: 00 3a 00 00
[86349.411207] sd 4:0:0:0: [sdc] Write cache: enabled, read cache: enabled, 
doesn't support DPO or FUA
[86349.425488] end_request: I/O error, dev sdc, sector 976767935
[86349.425488] md: super_written gets error=-5, uptodate=0
[86349.425488] raid10: Disk failure on sdc1, disabling device.


a.
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Hofferek Attila
Hegedüs Ervin írta:
 [86346.945481] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 
 frozen
 [86346.945510] ata3.00: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 0
 [86346.945512]  res 40/00:00:09:4f:c2/00:00:00:00:00/00 Emask 0x4 
 (timeout)
 [86346.945545] ata3.00: status: { DRDY }
 [86346.945564] ata3: hard resetting link
 [86349.393520] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 0)
 [86349.411207] ata3.00: configured for UDMA/100
 [86349.411207] ata3: EH complete
 [86349.411207] sd 4:0:0:0: [sdc] 976773168 512-byte hardware sectors (500108 
 MB)
 [86349.411207] sd 4:0:0:0: [sdc] Write Protect is off
 [86349.411207] sd 4:0:0:0: [sdc] Mode Sense: 00 3a 00 00
 [86349.411207] sd 4:0:0:0: [sdc] Write cache: enabled, read cache: enabled, 
 doesn't support DPO or FUA
 [86349.425488] end_request: I/O error, dev sdc, sector 976767935
 [86349.425488] md: super_written gets error=-5, uptodate=0
 [86349.425488] raid10: Disk failure on sdc1, disabling device.

Ez nekem nem sebessegbeli kulonbsegnek tunik, ez meg a radi alatti 
reteg(ek)ben kezdodik. Reprodukalhato a jelenseg? En megtesztelnem masik 
diskkel is.
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Andras HORVATH

 file torles szempontjabol van jelentosege, hogy mekkora volt az a file? 

ext3-on peldaul ugyancsak.

 [86349.425488] end_request: I/O error, dev sdc, sector 976767935
 [86349.425488] md: super_written gets error=-5, uptodate=0
 [86349.425488] raid10: Disk failure on sdc1, disabling device.

A doglott diszket kidobta az MD, ez nem MD problema, hanem diszk vagy
vezerlo (vagy kabel vagy tap).

r
-- 
Those who say it cannot be done should not interrupt the person doing it.
   -- Chinese proverb

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm raid10 szetesik

2010-04-30 bef zés Kónya Zoltán (EVM)

 [86349.425488] end_request: I/O error, dev sdc, sector 976767935

nem kizárható a kártya hiba sem, de én hdd-re gyanakszom
persze fura, hogy egymás után kettőt is eldob
raid-be tétel előtt mindig teszteld a hdd-t (pl. smartctl teljes 
ellenőrzés, badblock), ill. raidben is monitorozd a diskeket a smarttal

helyedben neki esnék a diszkeket tesztelésének

Üdv.,
Kónya Zoli





_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Hegedüs Ervin
hello,

  file torles szempontjabol van jelentosege, hogy mekkora volt az a file? 
 
 ext3-on peldaul ugyancsak.

miért?
 
  [86349.425488] end_request: I/O error, dev sdc, sector 976767935
  [86349.425488] md: super_written gets error=-5, uptodate=0
  [86349.425488] raid10: Disk failure on sdc1, disabling device.
 
 A doglott diszket kidobta az MD, ez nem MD problema, hanem diszk vagy
 vezerlo (vagy kabel vagy tap).

hmmm... ahogy írtam ez az eszköz (sdc) már rosszalkodott
korábban, készültem h előbb-utóbb gond lesz, tegnap csere volt,
ma megint kiesett zsír új diszkkel.

En - óvatosan ugyan - de a diszket kihúznám, marad a vezérlő
(csak egy csatorna?), de inkább valamelyik kábel...


Köszi:


a.

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Gabor HALASZ
On 2010.04.30. 15:20, Hegedüs Ervin wrote:

 Ezzel az üzenettel dobta ki a tömbből:


elotte mi van ?

 [86346.945481] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 
 frozen

nagy valoszinuseggel kernelbug, azt mondja, hogy fogalma sincs, mi 
tortent, sem arrol, hogy miert tortent, sem arrol, mi a hiba, ezert leall.

 [86346.945510] ata3.00: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 0

write cache flush

 [86346.945512]  res 40/00:00:09:4f:c2/00:00:00:00:00/00 Emask 0x4 
 (timeout)

timeout

 [86346.945545] ata3.00: status: { DRDY }

ready

 [86346.945564] ata3: hard resetting link
 [86349.393520] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 0)
 [86349.411207] ata3.00: configured for UDMA/100

Ez nem jo jel...

 [86349.411207] ata3: EH complete

Hibakezeles vege.

-- 
Gabor HALASZ halas...@freemail.hu
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Hegedüs Ervin
hello,

  Ezzel az üzenettel dobta ki a tömbből:
 
 
 elotte mi van ?

semmi. (egyéb nem idevonatkozó rendszerüzenetek: mail, ...)
 
  [86346.945481] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 
  frozen
 
 nagy valoszinuseggel kernelbug, azt mondja, hogy fogalma sincs, mi 
 tortent, sem arrol, hogy miert tortent, sem arrol, mi a hiba, ezert leall.

ok, értelmezzük kernel bugnak, de ezzel a bugocskával amúgy
elment 1.5 évet így a rendszer, egyszer jelzett már a diszkre
december végén, és tegnap előtt megállt a diszk - amit szintén
vissza tudtam tenni a bugos kernellel. Tegnap cseréltem szűz
diszkre, ami szintén kiesett. A Samsung-ról mondanak mindenféle
rosszat mostanában, akár igez is lehet h bekaptam egy szar
diszket, de jó lenne körbejárni a problémát.

(egyébként mondta h mi a baja, csak lejebb van:
[86349.425488] end_request: I/O error, dev sdc, sector 976767935
[86349.425488] md: super_written gets error=-5, uptodate=0)


A két nappal ezelőtti üzenet ez volt:


[34844995.336207] ata3.00: exception Emask 0x10 SAct 0x0 SErr 0x8 action 
0xe frozen
[34844995.336268] ata3.00: irq_stat 0x01100010, PHY RDY changed
[34844995.336302] ata3: SError: { 10B8B }
[34844995.336335] ata3.00: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 0
[34844995.336338]  res b0/1f:00:00:00:00/00:00:00:00:b0/00 Emask 0x12 
(ATA bus error)
[34844995.336420] ata3.00: status: { Busy }
[34844995.336452] ata3.00: error: { IDNF ABRT }
[34844995.336499] ata3: hard resetting link
[34845002.300353] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 0)
[34845002.313672] ata3.00: configured for UDMA/100
[34845002.313723] end_request: I/O error, dev sdc, sector 976767935
[34845002.313763] md: super_written gets error=-5, uptodate=0
[34845002.313799] raid10: Disk failure on sdc1, disabling device.
[34845002.313802] raid10: Operation continuing on 3 devices.
[34845002.313894] ata3: EH complete
[34845002.314260] sd 4:0:0:0: [sdc] 976773168 512-byte hardware sectors (500108 
MB)
[34845002.314370] sd 4:0:0:0: [sdc] Write Protect is off
[34845002.314408] sd 4:0:0:0: [sdc] Mode Sense: 00 3a 00 00
[34845002.314491] sd 4:0:0:0: [sdc] Write cache: enabled, read cache: enabled, 
doesn't support DPO or FUA

  [86349.411207] ata3: EH complete
 
 Hibakezeles vege.

ez alatt van a tényleges hiba.


Köszi:


a.


ps: visszanézve a hibaüzeneteket az azért gyanús, hogy mindkét
diszknél ugyanarra a szektorra rinyál... :)
976768065 szektorból áll a diszk...

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Pápai Balázs
Kónya Zoltán (EVM) írta:
 [86349.425488] end_request: I/O error, dev sdc, sector 976767935

 nem kizárható a kártya hiba sem, de én hdd-re gyanakszom
 persze fura, hogy egymás után kettőt is eldob
 raid-be tétel előtt mindig teszteld a hdd-t (pl. smartctl teljes 
 ellenőrzés, badblock), ill. raidben is monitorozd a diskeket a smarttal
 
 helyedben neki esnék a diszkeket tesztelésének
 
Érdemes lenne a kidobott diszket is megnézni máshol..


_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm raid10 szetesik

2010-04-30 bef zés Hegedüs Ervin
hello,

  nem kizárható a kártya hiba sem, de én hdd-re gyanakszom
  persze fura, hogy egymás után kettőt is eldob
  raid-be tétel előtt mindig teszteld a hdd-t (pl. smartctl teljes 
  ellenőrzés, badblock), ill. raidben is monitorozd a diskeket a smarttal
  
  helyedben neki esnék a diszkeket tesztelésének
  
 Érdemes lenne a kidobott diszket is megnézni máshol..

igen, ez tervbe van véve, remélhetőleg ma túl leszek rajta.

köszi:


a. 
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Kónya Zoltán (EVM)
A két nappal ezelőtti üzenet ez volt:
...
.

[34845002.313723] end_request: I/O error, dev sdc, sector 976767935

a mostani meg ez?
[86349.425488] end_request: I/O error, dev sdc, sector 976767935
ha jól látom ugyanarra a HW sectorra hivatkozik a két különböző disk esetén!?

lehet, hogy elnéztem, ha nem, akkor inkább kernel bug lehet!?
üdv,
Kónya Z.




_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Hegedüs Ervin
hello,

 A két nappal ezelőtti üzenet ez volt:
 ...
 .
 
 [34845002.313723] end_request: I/O error, dev sdc, sector 976767935
 
 a mostani meg ez?
 [86349.425488] end_request: I/O error, dev sdc, sector 976767935
 ha jól látom ugyanarra a HW sectorra hivatkozik a két különböző disk esetén!?

igen, ezt az egyik válaszban írtam h mijavér' lehet...
 
 lehet, hogy elnéztem, ha nem, akkor inkább kernel bug lehet!?

és mi idézi elő?
Ahogy írtam, kb 1.5 éve (kb 2008. okt.) megy a gép, azóta persze
volt frissítés. Ráadásul a tegnap előtti hiba javítása után volt
upgrade, és a kernel is frissült - tudom, nem jelent semmit. 

De pont emiatt (tehát hogy volt a gépen X kernel, a tegnapi
állapotig is csak két napja) miért nem jött elő máskor is?


Köszi:

a.
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm raid10 szetesik

2010-04-30 bef zés Gabor HALASZ
On Fri, 30 Apr 2010 16:33:13 +0200, Hegedüs Ervin airw...@freemail.hu
wrote:

 diszkre, ami szintén kiesett. A Samsung-ról mondanak mindenféle
 rosszat mostanában, akár igez is lehet h bekaptam egy szar
 diszket, de jó lenne körbejárni a problémát.

Nem tudom, mit akarsz jarkalni akorul, hogy nem adja vissza a hibakodot.

 
 (egyébként mondta h mi a baja, csak lejebb van:
 [86349.425488] end_request: I/O error, dev sdc, sector 976767935
 [86349.425488] md: super_written gets error=-5, uptodate=0)
 
 
 A két nappal ezelőtti üzenet ez volt:
 
 
 [34844995.336207] ata3.00: exception Emask 0x10 SAct 0x0 SErr 0x8
 action 0xe frozen

Itt van hibakod, ezt a kernelforras segitsegevel el lehet olvasni. Az
almoskonyv:

https://ata.wiki.kernel.org/index.php/Libata_error_messages


 
 ps: visszanézve a hibaüzeneteket az azért gyanús, hogy mindkét
 diszknél ugyanarra a szektorra rinyál... :)
 976768065 szektorból áll a diszk...
 

Az a baj, hogy az md is piszkalja a smart-ot, szoval van lehetoseg magiara
gazdagon. Tapot csereltel mar? Mielott fekete kakast aldozol kretakor
kozepen, probald meg
esetleg a sil kartya firmwaret frissiteni.

-- 
Gabor HALASZ halas...@freemail.hu

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: mdadm nem megy

2006-12-15 bef zés Szalai Ferenc
Nagy Gabor Peter wrote:
 Legalabb egy eve nem keszitettem software raid-et, most meg nem sikerul.
 Nem ertem mi a gond. Segitsetek!

 Ezt probalom (a man alapjan):

 bagoy:~# mdadm --create /dev/md0 -v --level=1 /dev/sda4 /dev/sdb3
 mdadm: error opening /dev/md0: No such file or directory
   
--auto=yes

--
Udv
Feri
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm nem megy

2006-12-15 bef zés Andras HORVATH

Nagy Gabor Peter [EMAIL PROTECTED] wrote:

 bagoy:~# mdadm --create /dev/md0 -v --level=1 /dev/sda4 /dev/sdb3
 mdadm: error opening /dev/md0: No such file or directory

-a opcio kell neked, az csinal maganak device file-okat.

raas
-- 
Those who say it cannot be done should not interrupt the person doing it.
   -- Chinese proverb

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm nem megy

2006-12-15 bef zés Nagy Gabor Peter
On 06-Dec-15 13:22, Andras HORVATH wrote:
 
 Nagy Gabor Peter [EMAIL PROTECTED] wrote:
 
  bagoy:~# mdadm --create /dev/md0 -v --level=1 /dev/sda4 /dev/sdb3
  mdadm: error opening /dev/md0: No such file or directory
 
 -a opcio kell neked, az csinal maganak device file-okat.

Aha, koszi!

G
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm nem megy

2006-12-15 bef zés Itsystem - -Értékház

 bagoy:~# mdadm --create /dev/md0 -v --level=1 /dev/sda4 /dev/sdb3
 mdadm: error opening /dev/md0: No such file or directory
 
 Nincs. Hat persze, hogy nincs, most kellene letrehozni. Nem ertem.
Nem hiányzik a kernelből a raid támogatás ?
én ezzel soktam: mdadm --create /dev/md0 -l1 -n2 /dev/hda1 /dev/hdc1
(megmondom hány diszk lesz.)

S.Z:

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm hotswap

2006-04-10 bef zés Andras HORVATH

Lajber Zoltan [EMAIL PROTECTED] wrote:
 Arra figyelj, hogy reboot nelkul a sdX elnevezes szerencsetlen: lehet,
 hogy amit kiveszel, az sda, amit beraksz, az meg sdh lesz pl.

tok mindegy, az mdadm a diszkre rairt UUID alapjan rakja ossze a RAID
tomboket.

a no such device az erdekes, szerintem nem kene ilyennek tortennie; az
md-nek fognia kellene a diszket. Gondolom udev-et hasznalsz? van
ilyenkor (amikor kihuzol egy addig aktiv diszket) meg /dev/sda (marmint
device file)?

raas
-- 
Those who say it cannot be done should not interrupt the person doing it.
   -- Chinese proverb

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm hotswap

2006-04-10 bef zés Lajber Zoltan
On Mon, 10 Apr 2006, Andras HORVATH wrote:

 tok mindegy, az mdadm a diszkre rairt UUID alapjan rakja ossze a RAID
 tomboket.

Igen, de pl a lilo nem.

 md-nek fognia kellene a diszket. Gondolom udev-et hasznalsz? van
 ilyenkor (amikor kihuzol egy addig aktiv diszket) meg /dev/sda (marmint
 device file)?

Ha csak kihuzom, akkor minden marad a regiben. Ha mast dugok vissza
helyette, akkor kezd kohogni esetleg. De az add/remove megoldja (meg a
reboot, de azt szeretnenk elkerulni)

Udv,
-=Lajbi=
 LAJBER Zoltan   Szent Istvan Egyetem,  Informatika Hivatal
  Experience is something you don't get until just after you need it
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm hotswap

2006-04-10 bef zés Csaba Halasz

Andras HORVATH [EMAIL PROTECTED] wrote:
 
 a no such device az erdekes, szerintem nem kene ilyennek tortennie; az
 md-nek fognia kellene a diszket. Gondolom udev-et hasznalsz? van
 ilyenkor (amikor kihuzol egy addig aktiv diszket) meg /dev/sda (marmint
 device file)?

Hú, lehet, hogy ez lesz a probléma!
Most sajna állnak a gépek, mert elszállt az egyik szünetmentes, de majd
megnézem.
Köszi!

-- 
HCS
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm hotswap

2006-04-09 bef zés Andras HORVATH

 2.6.12-es kernel, a marvell-féle bináris driver, mdadm verziója 1.9.0.

ez egy jo regi mdadm. 1.12-nel tartunk, nehol meg 1.11 van.

 a diszk failed lesz (ez jó is), de nem tudom eltávolítani a tömbböl,
 mert sír, hogy no such device. Ha ezután visszadugom, akkor már

konkretan mit csinalsz es mit mond ra?

hogy nez ki a /proc/mdstat elotte, utana, kozben?

raas
-- 
Those who say it cannot be done should not interrupt the person doing it.
   -- Chinese proverb

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm hotswap

2006-04-09 bef zés Csaba Halasz

Andras HORVATH [EMAIL PROTECTED] wrote:
 
 
 2.6.12-es kernel, a marvell-féle bináris driver, mdadm verziója 1.9.0.
 
 ez egy jo regi mdadm. 1.12-nel tartunk, nehol meg 1.11 van.

Ok, akkor egy frissítést megpróbálok majd.

 a diszk failed lesz (ez jó is), de nem tudom eltávolítani a tömbböl,
 mert sír, hogy no such device. Ha ezután visszadugom, akkor már
 
 konkretan mit csinalsz es mit mond ra?
 
 hogy nez ki a /proc/mdstat elotte, utana, kozben?

Jól néz ki ;)
Elötte minden normális, közben és utána a kihúzott diszk failed,
a többi jó. Azt csináltam, hogy diszk kihúz aztán 
mdadm /dev/md0 -r /dev/sda és azt mondta rá, hogy no such device.
Az új eszközt hozzá is tudtam adni a tömbhöz, és egy reboot
után meg is gyógyult az egész.

Erröl jut eszembe: raid5 resync közben van, hogy a cat /proc/mdstat
tízpercekig blokkolódik, ez normális? Itthon a raid1 nem csinál ilyet.

-- 
HCS
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm hotswap

2006-04-09 bef zés Csaba Halasz

Lajber Zoltan [EMAIL PROTECTED] wrote:
 
 On Sun, 9 Apr 2006, Csaba Halasz wrote:
 
 a többi jó. Azt csináltam, hogy diszk kihúz aztán
 mdadm /dev/md0 -r /dev/sda és azt mondta rá, hogy no such device.
 
 jobb sorrend az ,ha elobb kiveszed  raid tomb-bol, majd scsiadd -r, ujdisk
 berak, scsiadd -a, utanna mdadm.

Én csak kirántottam a hotswap fiókból, szimulálva, hogy mi lenne ha
meghalna. Mert mi lesz, ha meghal? Akkor nem ugyanez lesz, hogy
nem fogom tudni kivenni a tömbböl? scsiadd-ot nem próbáltam,
ha legközelebb a gépterem felé járok akkor megnézem attól jobb lesz-e.

 Arra figyelj, hogy reboot nelkul a sdX elnevezes szerencsetlen: lehet,
 hogy amit kiveszel, az sda, amit beraksz, az meg sdh lesz pl.

Az az érdekes, hogy ha nem tömbben lévö diszket húzok ki majd dugok
vissza, akkor ugyanazt az sdX eszközt kapja vissza.

Köszi a választ.

-- 
HCS
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: mdadm hotswap

2006-04-09 bef zés Lajber Zoltan
On Sun, 9 Apr 2006, Csaba Halasz wrote:

 Én csak kirántottam a hotswap fiókból, szimulálva, hogy mi lenne ha
 meghalna. Mert mi lesz, ha meghal? Akkor nem ugyanez lesz, hogy
 nem fogom tudni kivenni a tömbböl? scsiadd-ot nem próbáltam,
 ha legközelebb a gépterem felé járok akkor megnézem attól jobb lesz-e.

Ha ugy hal meg, hogy se kep, se hang, akkor tenyleg nem kell a scsiadd...
Ez sem igaz teljesen :)
Ha cska kicsereled, es pont ugyan olyanra, akkor ok.
De ha kicsit mas meretu (ami sw raid egyik elonye), akkor nem olvassa ujra
a geometriat, mig scsiadd -r/-a, vagy reboot nincs.


 Az az érdekes, hogy ha nem tömbben lévö diszket húzok ki majd dugok
 vissza, akkor ugyanazt az sdX eszközt kapja vissza.

Nem biztos, csak ha gyors vagy.

Udv,
-=Lajbi=
 LAJBER Zoltan   Szent Istvan Egyetem,  Informatika Hivatal
  Experience is something you don't get until just after you need it
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


mdadm hotswap

2006-04-07 bef zés Csaba Halasz

Hi!

Coraid etherdrive cuccra tettünk linuxot.
2.6.12-es kernel, a marvell-féle bináris driver, mdadm verziója 1.9.0.
Ha kihúzom majd visszadugom az egyik diszket ami nincs raidben,
akkor ugyanazt az eszközt rendeli hozzá.
Ha viszont raidben lévöt húzok le, akkor az mdadm szerint
a diszk failed lesz (ez jó is), de nem tudom eltávolítani a tömbböl,
mert sír, hogy no such device. Ha ezután visszadugom, akkor már
új eszközt rendel hozzá (feltehetöleg azért mert az md még fogja
az elözöt).

Mi erre a gyógyír? Ha mdadm-ot frissítek az segíthet? 
Vagy tök máshogy kellene csinálni?

Köszi.

-- 
HCS
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux