Re: [rlug] software raid munin smart data

2014-03-10 Fir de Conversatie Sîrbu Lucian
Dupa cateva fsck si reboots, se pare ca acum munin genereaza graficele cu
linie continuua... deci cred ca il pot considera fixed:)


2014-03-03 23:23 GMT+02:00 manuel lonely wolf wolfshant wo...@prolinux.ro
:

 On 03/03/2014 03:10 PM, Alex 'CAVE' Cernat wrote:
  ciudat ca doar unul din harduri, posibil sa aiba ceva probleme de
  sanatate sau mentale, dureaza smartctl-ul prea mult si din cauza asta se
  transforma din linii in puncte, pentru ca pluginul da timeout
 
  ce poti sa faci:
  - intri pe el si rulezi de mana pana te plictisesti smartctl -a
  /dev/sda, vezi ce se intampla (pe b vad ca e curat)
  - te uiti prin loguirle de munin, poate e ceva util pe acolo
  - chemi minerii
 
  dar mai intai te uiti prin valorile de smart, mie mi se par ok la prima
  vedere, ciudat e ca un hard sta in 29 si unul in 35, dar oricum
  temperatura e ok (daca ai putea s-o aduci si pe cea mare sub 30 ar fi
  excelent)
  am avut si 45 si a fost cat de cat ok, dar nu recomand ...
 
 redau mai jos niste citate de la Western Digital de pe site:
   http://www.wdc.com/wdproducts/library/SpecSheet/ENG/2879-701229.pdf
 (WD Green series)
 Temperature (°C)
 Operating0 to 60
 Non-operating-40 to 70

 http://www.wdc.com/wdproducts/library/SpecSheet/ENG/2879-771442.pdf ( WD
 Red - NAS Hard Drives)
 Temperature (°C)
 Operating   0 to 70
 Non-operating -40 to 70

 Iar Seagate ne spune
 (http://knowledge.seagate.com/articles/en_US/FAQ/193771en ):

 The drive should never exceed the temperature ranges below. If the
 drives ever exceed these temperature ranges then the drive is considered
 overheated or is not getting adequate air flow from your current case
 environment.

 With our newer model drives the maximum temperature is now at 60 degrees
 Celsius.

 The operating temperature range for most Seagate hard drives is 5 to 50
 degrees Celsius. A normal PC case should provide adequate cooling.




 ___
 RLUG mailing list
 RLUG@lists.lug.ro
 http://lists.lug.ro/mailman/listinfo/rlug




-- 

THE END of this transmission
___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


[rlug] software raid munin smart data

2014-03-03 Fir de Conversatie Sîrbu Lucian
Se da un raid software, format din 2 hdd-uri. Pe acel server ruleaza munin
si ma mai uit periodic la graficele generate de el.

De cateva zile vad ca pentru unul din cele 2 hdd-uri munin genereaza
puncte in loc de linii continue, cum facea pana acum.

sda: http://imgur.com/BqPt89j
sdb: http://imgur.com/KE5ivdg

In dmesg nu vad nici o eroare, iar in /proc/mdstat nu vad nimic suspicios.
A mai intalnit cineva asa ceva?

Posibil sa fi ramas Munin fara cerneala la grafice?:))



-- 

THE END of this transmission
___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: [rlug] software raid munin smart data

2014-03-03 Fir de Conversatie Alex 'CAVE' Cernat
ciudat ca doar unul din harduri, posibil sa aiba ceva probleme de 
sanatate sau mentale, dureaza smartctl-ul prea mult si din cauza asta se 
transforma din linii in puncte, pentru ca pluginul da timeout

ce poti sa faci:
- intri pe el si rulezi de mana pana te plictisesti smartctl -a 
/dev/sda, vezi ce se intampla (pe b vad ca e curat)
- te uiti prin loguirle de munin, poate e ceva util pe acolo
- chemi minerii

dar mai intai te uiti prin valorile de smart, mie mi se par ok la prima 
vedere, ciudat e ca un hard sta in 29 si unul in 35, dar oricum 
temperatura e ok (daca ai putea s-o aduci si pe cea mare sub 30 ar fi 
excelent)
am avut si 45 si a fost cat de cat ok, dar nu recomand ...

___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: [rlug] software raid munin smart data

2014-03-03 Fir de Conversatie Sîrbu Lucian
Am impresia ca exista un offset intre temperaturile hdd-urilor, dar
amandoua variaza identic in timp. Dar daca tot afiseaza mereu aceeasi
diferenta, am preferat sa le las asa, nu deranjeaza. Temperaturile pe anul
asta: http://imgur.com/qX495XF

In log-ul de munin am gasit asta: 2014/03/03-14:21:01 [28729] Node side
timeout while processing: 'fetch smart_sda'

Si apare de cateva ori pt astazi

Am pornit un while [1] do smartctl -a; sleep 1 ca sa vad daca se
blocheaza... desi nu vad de ce ar face probleme. Revin cu detalii...




2014-03-03 15:10 GMT+02:00 Alex 'CAVE' Cernat c...@cernat.ro:

 ciudat ca doar unul din harduri, posibil sa aiba ceva probleme de
 sanatate sau mentale, dureaza smartctl-ul prea mult si din cauza asta se
 transforma din linii in puncte, pentru ca pluginul da timeout

 ce poti sa faci:
 - intri pe el si rulezi de mana pana te plictisesti smartctl -a
 /dev/sda, vezi ce se intampla (pe b vad ca e curat)
 - te uiti prin loguirle de munin, poate e ceva util pe acolo
 - chemi minerii

 dar mai intai te uiti prin valorile de smart, mie mi se par ok la prima
 vedere, ciudat e ca un hard sta in 29 si unul in 35, dar oricum
 temperatura e ok (daca ai putea s-o aduci si pe cea mare sub 30 ar fi
 excelent)
 am avut si 45 si a fost cat de cat ok, dar nu recomand ...

 ___
 RLUG mailing list
 RLUG@lists.lug.ro
 http://lists.lug.ro/mailman/listinfo/rlug




-- 

THE END of this transmission
___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: [rlug] software raid munin smart data

2014-03-03 Fir de Conversatie manuel lonely wolf wolfshant
On 03/03/2014 03:10 PM, Alex 'CAVE' Cernat wrote:
 ciudat ca doar unul din harduri, posibil sa aiba ceva probleme de
 sanatate sau mentale, dureaza smartctl-ul prea mult si din cauza asta se
 transforma din linii in puncte, pentru ca pluginul da timeout

 ce poti sa faci:
 - intri pe el si rulezi de mana pana te plictisesti smartctl -a
 /dev/sda, vezi ce se intampla (pe b vad ca e curat)
 - te uiti prin loguirle de munin, poate e ceva util pe acolo
 - chemi minerii

 dar mai intai te uiti prin valorile de smart, mie mi se par ok la prima
 vedere, ciudat e ca un hard sta in 29 si unul in 35, dar oricum
 temperatura e ok (daca ai putea s-o aduci si pe cea mare sub 30 ar fi
 excelent)
 am avut si 45 si a fost cat de cat ok, dar nu recomand ...

redau mai jos niste citate de la Western Digital de pe site:
  http://www.wdc.com/wdproducts/library/SpecSheet/ENG/2879-701229.pdf 
(WD Green series)
Temperature (°C)
Operating0 to 60
Non-operating-40 to 70

http://www.wdc.com/wdproducts/library/SpecSheet/ENG/2879-771442.pdf ( WD 
Red - NAS Hard Drives)
Temperature (°C)
Operating   0 to 70
Non-operating -40 to 70

Iar Seagate ne spune 
(http://knowledge.seagate.com/articles/en_US/FAQ/193771en ):

The drive should never exceed the temperature ranges below. If the 
drives ever exceed these temperature ranges then the drive is considered 
overheated or is not getting adequate air flow from your current case 
environment.

With our newer model drives the maximum temperature is now at 60 degrees 
Celsius.

The operating temperature range for most Seagate hard drives is 5 to 50 
degrees Celsius. A normal PC case should provide adequate cooling.




___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: [rlug] [Software RAID failed disk] Am o masina...

2006-09-25 Fir de Conversatie Catalin Muresan

On 9/25/06, George Razvan NICA [EMAIL PROTECTED] wrote:

...cu 3 discuri, dupa cum urmeaza:

/dev/md0 - RAID1, /dev/sda1, /dev/sdb1, /dev/sdc1
/dev/md1 - RAID5, /dev/sda3, /dev/sdb3, /dev/sdc3
/dev/md2 - RAID5, /dev/sda4, /dev/sdb4, /dev/sdc4

Discul /dev/sda e failed, dar doar in array-urile md1 si md2. Am
incercat madm /dev/md1 -r /dev/sda3 urmat de mdadm /dev/md1 -a
/dev/sda3 si a reusit sa faca rebuild. Dupa ce am incercat ceva
simillar si pentru md2 a inceput sa lucreze dar am ajuns in aceeasi
stare dupa ceva munca.


nici un motiv? erori pe bus? smart pe disk-uri ai verificat?


Sugestii? Daca inlocuiesc discul, e o problema (fiind RAID5) daca nu
gasesc disc identic sau va face un soi de shrink to the smallest one
fara sa ma stresez eu?


ti se pare normal ca un FS sa simta dintr-odata ca s-a scurtat
device-ul pe care e si sa nu se streseze ? sincer n-am incercar
vreodata, decit sa pun hdd-uri mai mari, dar 100% o sa fie probleme,
probabil nu o sa te lase sa-l pui in array.

recomandat e ca inainte de a-l inlocui sa afli numarul de sectoare
care ar trebui sa fie cel putin egal cu al celui inlocuit.



Multumesc anticipat pentru ajutor.

Iata mai jos un cat /proc/mdstat de pe masina:

=== cut here ===
Personalities : [raid5] [raid4] [raid1] [raid0]
md0 : active raid1 sda1[0] sdc1[2] sdb1[1]
  96256 blocks [3/3] [UUU]

md2 : active raid5 sda4[3](F) sdc4[2] sdb4[1]
  297716352 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]

md1 : active raid5 sda3[3](F) sdc3[2] sdb3[1]
  13671168 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]
=== and here ===


pai se pare ca totusi, md1 si md2 nu au sda4 si sda3 totusi.



--
GRN

http://nano.cube.ro - the man behind
http://www.infinium.ro - the business

___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug



___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: [rlug] [Software RAID failed disk] Am o masina...

2006-09-25 Fir de Conversatie Mihai Albu

George Razvan NICA wrote:

...cu 3 discuri, dupa cum urmeaza:

/dev/md0 - RAID1, /dev/sda1, /dev/sdb1, /dev/sdc1
/dev/md1 - RAID5, /dev/sda3, /dev/sdb3, /dev/sdc3
/dev/md2 - RAID5, /dev/sda4, /dev/sdb4, /dev/sdc4

Discul /dev/sda e failed, dar doar in array-urile md1 si md2. Am
incercat madm /dev/md1 -r /dev/sda3 urmat de mdadm /dev/md1 -a
/dev/sda3 si a reusit sa faca rebuild. Dupa ce am incercat ceva
simillar si pentru md2 a inceput sa lucreze dar am ajuns in aceeasi
stare dupa ceva munca.

Sugestii? Daca inlocuiesc discul, e o problema (fiind RAID5) daca nu
gasesc disc identic sau va face un soi de shrink to the smallest one
fara sa ma stresez eu?

Multumesc anticipat pentru ajutor.

Iata mai jos un cat /proc/mdstat de pe masina:

=== cut here ===
Personalities : [raid5] [raid4] [raid1] [raid0]
md0 : active raid1 sda1[0] sdc1[2] sdb1[1]
 96256 blocks [3/3] [UUU]

md2 : active raid5 sda4[3](F) sdc4[2] sdb4[1]
 297716352 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]

md1 : active raid5 sda3[3](F) sdc3[2] sdb3[1]
 13671168 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]
=== and here ===

Pai cumperi un disc cel putin la fel de mare ca celelalte, si creezi 
partitii pe el de aceeasi marime cu cele initiale.Daca il iei mai mic 
probabil n-o sa te lase sa-l bagi in array. Sau ma rog...never 
underestimate the power of --force



___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: [rlug] [Software RAID failed disk] Am o masina...

2006-09-25 Fir de Conversatie lonely wolf

George Razvan NICA wrote:

...cu 3 discuri, dupa cum urmeaza:

/dev/md0 - RAID1, /dev/sda1, /dev/sdb1, /dev/sdc1
/dev/md1 - RAID5, /dev/sda3, /dev/sdb3, /dev/sdc3
/dev/md2 - RAID5, /dev/sda4, /dev/sdb4, /dev/sdc4

Discul /dev/sda e failed, dar doar in array-urile md1 si md2. Am
incercat madm /dev/md1 -r /dev/sda3 urmat de mdadm /dev/md1 -a
/dev/sda3 si a reusit sa faca rebuild. Dupa ce am incercat ceva
simillar si pentru md2 a inceput sa lucreze dar am ajuns in aceeasi
stare dupa ceva munca.
fiindca eroarea reapare. am si eu in clipa asta un raid5 in aceeasi 
stare si vinez de o sapt un HDD cu 5 ani garantie ca sa il pun in loc




Sugestii?
inlocuieste sda. cu ceva reliable, chiar daca mai scump. si ai grja la 
racire.



Daca inlocuiesc discul, e o problema (fiind RAID5) daca nu
gasesc disc identic sau va face un soi de shrink to the smallest one
fara sa ma stresez eu?
nu incerca sa pui in loc o partitie mai mica decit cea existenta, in 
nici un array. ori nu o sa te lase, ori o sa faci info praf




Iata mai jos un cat /proc/mdstat de pe masina:

=== cut here ===
Personalities : [raid5] [raid4] [raid1] [raid0]
md0 : active raid1 sda1[0] sdc1[2] sdb1[1]
 96256 blocks [3/3] [UUU]

md2 : active raid5 sda4[3](F) sdc4[2] sdb4[1]
 297716352 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]

md1 : active raid5 sda3[3](F) sdc3[2] sdb3[1]
 13671168 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]
=== and here ===



daca e fail in toate md-urile, dpdv performanta iti recomand sa refaci 
md-urile pe rind, dupa ce termina de reconstruit cite unul; altfel o sa 
iti faca varza bus-ul si/sau o sa dureze o mie de ani


--
Every morning is the dawn of a new error.


___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: [rlug] [Software RAID failed disk] Am o masina...

2006-09-25 Fir de Conversatie sin
lonely wolf wrote:


 
 daca e fail in toate md-urile, dpdv performanta iti recomand sa refaci
 md-urile pe rind, dupa ce termina de reconstruit cite unul; altfel o sa
 iti faca varza bus-ul si/sau o sa dureze o mie de ani
 

rebuild-ul de raid soft se face unul dupa altul (daca ai mai multe
array-uri pe acelasi disc).  se face paralel doar daca ai discurile pe
bus-uri separate (eg. 2 discuri pe un bus, 2 pe altul)

___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: Re: [rlug] [Software RAID failed disk] Am o masina...

2006-09-25 Fir de Conversatie George Razvan NICA

ti se pare normal ca un FS sa simta dintr-odata ca s-a scurtat
device-ul pe care e si sa nu se streseze ? sincer n-am incercar
vreodata, decit sa pun hdd-uri mai mari, dar 100% o sa fie probleme,
probabil nu o sa te lase sa-l pui in array.


Intrebam; nu e o problema sa iau ceva _mai_mare_ insa vroiam sa stiu
cum stau. Pentru moment m-am asigurat ca arunc 60GB de mail-uri si
pe masina de langa, sa nu raman in pom daca am vreo surpriza deosebita
pana rezolv.


pai se pare ca totusi, md1 si md2 nu au sda4 si sda3 totusi.


Uite si bucati de dmesg, poate ajuta:

=== cut here ===
RAID5 conf printout:
--- rd:3 wd:2 fd:1
disk 0, o:0, dev:sda4
disk 1, o:1, dev:sdb4
disk 2, o:1, dev:sdc4
RAID5 conf printout:
--- rd:3 wd:2 fd:1
disk 1, o:1, dev:sdb4
disk 2, o:1, dev:sdc4
ata1: command 0x35 timeout, stat 0xd0 host_stat 0x40
ata1: translated ATA stat/err 0xd0/00 to SCSI SK/ASC/ASCQ 0xb/47/00
ata1: status=0xd0 { Busy }
sd 0:0:0:0: SCSI error: return code = 0x802
sda: Current: sense key: Aborted Command
   Additional sense: Scsi parity error
end_request: I/O error, dev sda, sector 1214410
raid5: Disk failure on sda3, disabling device. Operation continuing on 2 devices
=== and here ===

--
GRN

http://nano.cube.ro - the man behind
http://www.infinium.ro - the business

___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: Re[2]: [rlug] Software Raid

2006-06-17 Fir de Conversatie Ratiu Petru

 Nu prea inteleg ce-ai facut.. Ai avut un sistem fara raid si ai facut raid
 clonand la mana o partitie? Sau ai facut un fel de backup duplicand una din
 partitiile din raid?
Am clonat un sistem la mana :)



Wha? Cum la mana? Cu dd? Wrong! El are niste semnaturi pe acolo, nu
poti sa faci chiar asa.

Procedura care se foloseste cand vrei sa transformi un sistem din disc
simplu in raid1 si n-ai spatiu de backup e asa:

1. bagi discul nou in sistem
2. il partitionezi asa cum o sa vrei sa fie final (cu partitiile ce
vor fi membre raid de tip 0xfd)
3. faci cu mdadm matricea raid , numai ca acolo unde ar fi partitia
care are inca date pe ea spui missing. Ceva gen mdadm --create
/dev/md0 -l1 -n2 /dev/sdb1 missing. In /proc/mdstat ar trebui sa apara
matricea cu un disc lipsa.
4. formatezi raidu, il montezi, si copiezi datele pe el.
5. demontezi partitia originala si montezi raidul in loc. Daca
operatia afecteaza si /boot, se reinstaleaza bootloaderul de pe
partitia membra raid. Reboot dupa caz.
6. se adauga partitia originala (acum nefolosita) in raid. S-ar putea
sa maraie ca are filesystem, cred ca e nevoie de un --force.
7. astepti sa faca resync si cam asta a fost. Daca e si /boot
implicat, se instaleaza corect bootloaderul pe ambele discuri.



Asta ai facut, nu?  ;-)

Petre.

___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: [rlug] Software Raid

2006-06-17 Fir de Conversatie Dragos CHIRIAC

Ratiu Petru wrote:


Procedura care se foloseste cand vrei sa transformi un sistem din disc
simplu in raid1 si n-ai spatiu de backup e asa:

1. bagi discul nou in sistem



omu a zis : 

Ma ajuta cineva cu rezolvarea unei probleme raid? Am facut o clona a
unui server prin  intreruperea mirror'ului din original  si pornirea in
clona. . banuiesc ca avea raid si inainte, desi sincer nu pot sa spun ca 
inteleg perfect ce vrea omu sa zica.

Acu presupun si io ca a folosit mdadm si ca are superblockuri (persistente).

Ar fi o idee sa scoata din raid partitia cu bube, sa dea zero-superblock, si sa reataseze. poate se repara (in sensu ca d-zeu stie ce o fi facut omul de acum UUID-urile din superblockurile celor doua partitii care ar trebui sa fie in raid sunt diferite, si simptomatica cam asta indica). 



pt mai multe detalii trimite-ne si noua un :

mdadm -E /dev/sdc1; mdadm -E /dev/sdd1;

si eventual un

mdadm -D /dev/md7

sa vedem si noi ce balarii ai facut de se comporta asa.


Dragos
*
*


___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


[rlug] Software Raid

2006-06-16 Fir de Conversatie Mihai Patru
Salutare,

Ma ajuta cineva cu rezolvarea unei probleme raid? Am facut o clona a
unui server prin intreruperea mirror'ului din original si pornirea in
clona.

Pe clona totul merge bine in schimb, originalul a capatat o buba ce
arata cam asa:

md7 : active raid1 sdd1[1] sdc1[0]
  293033536 blocks [1/1] [U]

Ultimul disc a fost folosit pentru generarea clonei.

M'am tot dat pe net incercand sa gasesc o solutie dar nu prea am avut
succes.

Ceva idei?!?!

Cu respect,
Mihai P.




___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: [rlug] Software Raid

2006-06-16 Fir de Conversatie Ratiu Petru

On 6/16/06, Mihai Patru [EMAIL PROTECTED] wrote:

Salutare,

Ma ajuta cineva cu rezolvarea unei probleme raid? Am facut o clona a
unui server prin intreruperea mirror'ului din original si pornirea in
clona.

Pe clona totul merge bine in schimb, originalul a capatat o buba ce
arata cam asa:

md7 : active raid1 sdd1[1] sdc1[0]
  293033536 blocks [1/1] [U]


Scoate discul si baga-l la loc, sa fortezi un rsync:

mdadm --remove /dev/md7 /dev/sdc1
mdadm --add /dev/md7 /dev/sdc1

dupa care stai cu geana pe /proc/mdstat sa vezi ca se sincronizeaza.

This should be all.

Petre.

___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug


Re: [rlug] Software Raid

2006-06-16 Fir de Conversatie Daniel Vrabioiu

On 6/16/06, Mihai Patru [EMAIL PROTECTED] wrote:


Salutare,

Ma ajuta cineva cu rezolvarea unei probleme raid? Am facut o clona a
unui server prin intreruperea mirror'ului din original si pornirea in
clona.

Pe clona totul merge bine in schimb, originalul a capatat o buba ce
arata cam asa:

md7 : active raid1 sdd1[1] sdc1[0]
  293033536 blocks [1/1] [U]

Ultimul disc a fost folosit pentru generarea clonei.

M'am tot dat pe net incercand sa gasesc o solutie dar nu prea am avut
succes.

Ceva idei?!?!



Nu prea inteleg ce-ai facut.. Ai avut un sistem fara raid si ai facut raid
clonand la mana o partitie? Sau ai facut un fel de backup duplicand una din
partitiile din raid?

Ma rog.. in mare parte din cazuri poti sa rezolvi daca scoti partitia din
raid si o adaugi la loc..


--
danyvip
___
RLUG mailing list
RLUG@lists.lug.ro
http://lists.lug.ro/mailman/listinfo/rlug