Re: [rlug] software raid munin smart data
Dupa cateva fsck si reboots, se pare ca acum munin genereaza graficele cu linie continuua... deci cred ca il pot considera fixed:) 2014-03-03 23:23 GMT+02:00 manuel lonely wolf wolfshant wo...@prolinux.ro : On 03/03/2014 03:10 PM, Alex 'CAVE' Cernat wrote: ciudat ca doar unul din harduri, posibil sa aiba ceva probleme de sanatate sau mentale, dureaza smartctl-ul prea mult si din cauza asta se transforma din linii in puncte, pentru ca pluginul da timeout ce poti sa faci: - intri pe el si rulezi de mana pana te plictisesti smartctl -a /dev/sda, vezi ce se intampla (pe b vad ca e curat) - te uiti prin loguirle de munin, poate e ceva util pe acolo - chemi minerii dar mai intai te uiti prin valorile de smart, mie mi se par ok la prima vedere, ciudat e ca un hard sta in 29 si unul in 35, dar oricum temperatura e ok (daca ai putea s-o aduci si pe cea mare sub 30 ar fi excelent) am avut si 45 si a fost cat de cat ok, dar nu recomand ... redau mai jos niste citate de la Western Digital de pe site: http://www.wdc.com/wdproducts/library/SpecSheet/ENG/2879-701229.pdf (WD Green series) Temperature (°C) Operating0 to 60 Non-operating-40 to 70 http://www.wdc.com/wdproducts/library/SpecSheet/ENG/2879-771442.pdf ( WD Red - NAS Hard Drives) Temperature (°C) Operating 0 to 70 Non-operating -40 to 70 Iar Seagate ne spune (http://knowledge.seagate.com/articles/en_US/FAQ/193771en ): The drive should never exceed the temperature ranges below. If the drives ever exceed these temperature ranges then the drive is considered overheated or is not getting adequate air flow from your current case environment. With our newer model drives the maximum temperature is now at 60 degrees Celsius. The operating temperature range for most Seagate hard drives is 5 to 50 degrees Celsius. A normal PC case should provide adequate cooling. ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug -- THE END of this transmission ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
[rlug] software raid munin smart data
Se da un raid software, format din 2 hdd-uri. Pe acel server ruleaza munin si ma mai uit periodic la graficele generate de el. De cateva zile vad ca pentru unul din cele 2 hdd-uri munin genereaza puncte in loc de linii continue, cum facea pana acum. sda: http://imgur.com/BqPt89j sdb: http://imgur.com/KE5ivdg In dmesg nu vad nici o eroare, iar in /proc/mdstat nu vad nimic suspicios. A mai intalnit cineva asa ceva? Posibil sa fi ramas Munin fara cerneala la grafice?:)) -- THE END of this transmission ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: [rlug] software raid munin smart data
ciudat ca doar unul din harduri, posibil sa aiba ceva probleme de sanatate sau mentale, dureaza smartctl-ul prea mult si din cauza asta se transforma din linii in puncte, pentru ca pluginul da timeout ce poti sa faci: - intri pe el si rulezi de mana pana te plictisesti smartctl -a /dev/sda, vezi ce se intampla (pe b vad ca e curat) - te uiti prin loguirle de munin, poate e ceva util pe acolo - chemi minerii dar mai intai te uiti prin valorile de smart, mie mi se par ok la prima vedere, ciudat e ca un hard sta in 29 si unul in 35, dar oricum temperatura e ok (daca ai putea s-o aduci si pe cea mare sub 30 ar fi excelent) am avut si 45 si a fost cat de cat ok, dar nu recomand ... ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: [rlug] software raid munin smart data
Am impresia ca exista un offset intre temperaturile hdd-urilor, dar amandoua variaza identic in timp. Dar daca tot afiseaza mereu aceeasi diferenta, am preferat sa le las asa, nu deranjeaza. Temperaturile pe anul asta: http://imgur.com/qX495XF In log-ul de munin am gasit asta: 2014/03/03-14:21:01 [28729] Node side timeout while processing: 'fetch smart_sda' Si apare de cateva ori pt astazi Am pornit un while [1] do smartctl -a; sleep 1 ca sa vad daca se blocheaza... desi nu vad de ce ar face probleme. Revin cu detalii... 2014-03-03 15:10 GMT+02:00 Alex 'CAVE' Cernat c...@cernat.ro: ciudat ca doar unul din harduri, posibil sa aiba ceva probleme de sanatate sau mentale, dureaza smartctl-ul prea mult si din cauza asta se transforma din linii in puncte, pentru ca pluginul da timeout ce poti sa faci: - intri pe el si rulezi de mana pana te plictisesti smartctl -a /dev/sda, vezi ce se intampla (pe b vad ca e curat) - te uiti prin loguirle de munin, poate e ceva util pe acolo - chemi minerii dar mai intai te uiti prin valorile de smart, mie mi se par ok la prima vedere, ciudat e ca un hard sta in 29 si unul in 35, dar oricum temperatura e ok (daca ai putea s-o aduci si pe cea mare sub 30 ar fi excelent) am avut si 45 si a fost cat de cat ok, dar nu recomand ... ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug -- THE END of this transmission ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: [rlug] software raid munin smart data
On 03/03/2014 03:10 PM, Alex 'CAVE' Cernat wrote: ciudat ca doar unul din harduri, posibil sa aiba ceva probleme de sanatate sau mentale, dureaza smartctl-ul prea mult si din cauza asta se transforma din linii in puncte, pentru ca pluginul da timeout ce poti sa faci: - intri pe el si rulezi de mana pana te plictisesti smartctl -a /dev/sda, vezi ce se intampla (pe b vad ca e curat) - te uiti prin loguirle de munin, poate e ceva util pe acolo - chemi minerii dar mai intai te uiti prin valorile de smart, mie mi se par ok la prima vedere, ciudat e ca un hard sta in 29 si unul in 35, dar oricum temperatura e ok (daca ai putea s-o aduci si pe cea mare sub 30 ar fi excelent) am avut si 45 si a fost cat de cat ok, dar nu recomand ... redau mai jos niste citate de la Western Digital de pe site: http://www.wdc.com/wdproducts/library/SpecSheet/ENG/2879-701229.pdf (WD Green series) Temperature (°C) Operating0 to 60 Non-operating-40 to 70 http://www.wdc.com/wdproducts/library/SpecSheet/ENG/2879-771442.pdf ( WD Red - NAS Hard Drives) Temperature (°C) Operating 0 to 70 Non-operating -40 to 70 Iar Seagate ne spune (http://knowledge.seagate.com/articles/en_US/FAQ/193771en ): The drive should never exceed the temperature ranges below. If the drives ever exceed these temperature ranges then the drive is considered overheated or is not getting adequate air flow from your current case environment. With our newer model drives the maximum temperature is now at 60 degrees Celsius. The operating temperature range for most Seagate hard drives is 5 to 50 degrees Celsius. A normal PC case should provide adequate cooling. ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: [rlug] [Software RAID failed disk] Am o masina...
On 9/25/06, George Razvan NICA [EMAIL PROTECTED] wrote: ...cu 3 discuri, dupa cum urmeaza: /dev/md0 - RAID1, /dev/sda1, /dev/sdb1, /dev/sdc1 /dev/md1 - RAID5, /dev/sda3, /dev/sdb3, /dev/sdc3 /dev/md2 - RAID5, /dev/sda4, /dev/sdb4, /dev/sdc4 Discul /dev/sda e failed, dar doar in array-urile md1 si md2. Am incercat madm /dev/md1 -r /dev/sda3 urmat de mdadm /dev/md1 -a /dev/sda3 si a reusit sa faca rebuild. Dupa ce am incercat ceva simillar si pentru md2 a inceput sa lucreze dar am ajuns in aceeasi stare dupa ceva munca. nici un motiv? erori pe bus? smart pe disk-uri ai verificat? Sugestii? Daca inlocuiesc discul, e o problema (fiind RAID5) daca nu gasesc disc identic sau va face un soi de shrink to the smallest one fara sa ma stresez eu? ti se pare normal ca un FS sa simta dintr-odata ca s-a scurtat device-ul pe care e si sa nu se streseze ? sincer n-am incercar vreodata, decit sa pun hdd-uri mai mari, dar 100% o sa fie probleme, probabil nu o sa te lase sa-l pui in array. recomandat e ca inainte de a-l inlocui sa afli numarul de sectoare care ar trebui sa fie cel putin egal cu al celui inlocuit. Multumesc anticipat pentru ajutor. Iata mai jos un cat /proc/mdstat de pe masina: === cut here === Personalities : [raid5] [raid4] [raid1] [raid0] md0 : active raid1 sda1[0] sdc1[2] sdb1[1] 96256 blocks [3/3] [UUU] md2 : active raid5 sda4[3](F) sdc4[2] sdb4[1] 297716352 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU] md1 : active raid5 sda3[3](F) sdc3[2] sdb3[1] 13671168 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU] === and here === pai se pare ca totusi, md1 si md2 nu au sda4 si sda3 totusi. -- GRN http://nano.cube.ro - the man behind http://www.infinium.ro - the business ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: [rlug] [Software RAID failed disk] Am o masina...
George Razvan NICA wrote: ...cu 3 discuri, dupa cum urmeaza: /dev/md0 - RAID1, /dev/sda1, /dev/sdb1, /dev/sdc1 /dev/md1 - RAID5, /dev/sda3, /dev/sdb3, /dev/sdc3 /dev/md2 - RAID5, /dev/sda4, /dev/sdb4, /dev/sdc4 Discul /dev/sda e failed, dar doar in array-urile md1 si md2. Am incercat madm /dev/md1 -r /dev/sda3 urmat de mdadm /dev/md1 -a /dev/sda3 si a reusit sa faca rebuild. Dupa ce am incercat ceva simillar si pentru md2 a inceput sa lucreze dar am ajuns in aceeasi stare dupa ceva munca. Sugestii? Daca inlocuiesc discul, e o problema (fiind RAID5) daca nu gasesc disc identic sau va face un soi de shrink to the smallest one fara sa ma stresez eu? Multumesc anticipat pentru ajutor. Iata mai jos un cat /proc/mdstat de pe masina: === cut here === Personalities : [raid5] [raid4] [raid1] [raid0] md0 : active raid1 sda1[0] sdc1[2] sdb1[1] 96256 blocks [3/3] [UUU] md2 : active raid5 sda4[3](F) sdc4[2] sdb4[1] 297716352 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU] md1 : active raid5 sda3[3](F) sdc3[2] sdb3[1] 13671168 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU] === and here === Pai cumperi un disc cel putin la fel de mare ca celelalte, si creezi partitii pe el de aceeasi marime cu cele initiale.Daca il iei mai mic probabil n-o sa te lase sa-l bagi in array. Sau ma rog...never underestimate the power of --force ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: [rlug] [Software RAID failed disk] Am o masina...
George Razvan NICA wrote: ...cu 3 discuri, dupa cum urmeaza: /dev/md0 - RAID1, /dev/sda1, /dev/sdb1, /dev/sdc1 /dev/md1 - RAID5, /dev/sda3, /dev/sdb3, /dev/sdc3 /dev/md2 - RAID5, /dev/sda4, /dev/sdb4, /dev/sdc4 Discul /dev/sda e failed, dar doar in array-urile md1 si md2. Am incercat madm /dev/md1 -r /dev/sda3 urmat de mdadm /dev/md1 -a /dev/sda3 si a reusit sa faca rebuild. Dupa ce am incercat ceva simillar si pentru md2 a inceput sa lucreze dar am ajuns in aceeasi stare dupa ceva munca. fiindca eroarea reapare. am si eu in clipa asta un raid5 in aceeasi stare si vinez de o sapt un HDD cu 5 ani garantie ca sa il pun in loc Sugestii? inlocuieste sda. cu ceva reliable, chiar daca mai scump. si ai grja la racire. Daca inlocuiesc discul, e o problema (fiind RAID5) daca nu gasesc disc identic sau va face un soi de shrink to the smallest one fara sa ma stresez eu? nu incerca sa pui in loc o partitie mai mica decit cea existenta, in nici un array. ori nu o sa te lase, ori o sa faci info praf Iata mai jos un cat /proc/mdstat de pe masina: === cut here === Personalities : [raid5] [raid4] [raid1] [raid0] md0 : active raid1 sda1[0] sdc1[2] sdb1[1] 96256 blocks [3/3] [UUU] md2 : active raid5 sda4[3](F) sdc4[2] sdb4[1] 297716352 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU] md1 : active raid5 sda3[3](F) sdc3[2] sdb3[1] 13671168 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU] === and here === daca e fail in toate md-urile, dpdv performanta iti recomand sa refaci md-urile pe rind, dupa ce termina de reconstruit cite unul; altfel o sa iti faca varza bus-ul si/sau o sa dureze o mie de ani -- Every morning is the dawn of a new error. ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: [rlug] [Software RAID failed disk] Am o masina...
lonely wolf wrote: daca e fail in toate md-urile, dpdv performanta iti recomand sa refaci md-urile pe rind, dupa ce termina de reconstruit cite unul; altfel o sa iti faca varza bus-ul si/sau o sa dureze o mie de ani rebuild-ul de raid soft se face unul dupa altul (daca ai mai multe array-uri pe acelasi disc). se face paralel doar daca ai discurile pe bus-uri separate (eg. 2 discuri pe un bus, 2 pe altul) ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: Re: [rlug] [Software RAID failed disk] Am o masina...
ti se pare normal ca un FS sa simta dintr-odata ca s-a scurtat device-ul pe care e si sa nu se streseze ? sincer n-am incercar vreodata, decit sa pun hdd-uri mai mari, dar 100% o sa fie probleme, probabil nu o sa te lase sa-l pui in array. Intrebam; nu e o problema sa iau ceva _mai_mare_ insa vroiam sa stiu cum stau. Pentru moment m-am asigurat ca arunc 60GB de mail-uri si pe masina de langa, sa nu raman in pom daca am vreo surpriza deosebita pana rezolv. pai se pare ca totusi, md1 si md2 nu au sda4 si sda3 totusi. Uite si bucati de dmesg, poate ajuta: === cut here === RAID5 conf printout: --- rd:3 wd:2 fd:1 disk 0, o:0, dev:sda4 disk 1, o:1, dev:sdb4 disk 2, o:1, dev:sdc4 RAID5 conf printout: --- rd:3 wd:2 fd:1 disk 1, o:1, dev:sdb4 disk 2, o:1, dev:sdc4 ata1: command 0x35 timeout, stat 0xd0 host_stat 0x40 ata1: translated ATA stat/err 0xd0/00 to SCSI SK/ASC/ASCQ 0xb/47/00 ata1: status=0xd0 { Busy } sd 0:0:0:0: SCSI error: return code = 0x802 sda: Current: sense key: Aborted Command Additional sense: Scsi parity error end_request: I/O error, dev sda, sector 1214410 raid5: Disk failure on sda3, disabling device. Operation continuing on 2 devices === and here === -- GRN http://nano.cube.ro - the man behind http://www.infinium.ro - the business ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: Re[2]: [rlug] Software Raid
Nu prea inteleg ce-ai facut.. Ai avut un sistem fara raid si ai facut raid clonand la mana o partitie? Sau ai facut un fel de backup duplicand una din partitiile din raid? Am clonat un sistem la mana :) Wha? Cum la mana? Cu dd? Wrong! El are niste semnaturi pe acolo, nu poti sa faci chiar asa. Procedura care se foloseste cand vrei sa transformi un sistem din disc simplu in raid1 si n-ai spatiu de backup e asa: 1. bagi discul nou in sistem 2. il partitionezi asa cum o sa vrei sa fie final (cu partitiile ce vor fi membre raid de tip 0xfd) 3. faci cu mdadm matricea raid , numai ca acolo unde ar fi partitia care are inca date pe ea spui missing. Ceva gen mdadm --create /dev/md0 -l1 -n2 /dev/sdb1 missing. In /proc/mdstat ar trebui sa apara matricea cu un disc lipsa. 4. formatezi raidu, il montezi, si copiezi datele pe el. 5. demontezi partitia originala si montezi raidul in loc. Daca operatia afecteaza si /boot, se reinstaleaza bootloaderul de pe partitia membra raid. Reboot dupa caz. 6. se adauga partitia originala (acum nefolosita) in raid. S-ar putea sa maraie ca are filesystem, cred ca e nevoie de un --force. 7. astepti sa faca resync si cam asta a fost. Daca e si /boot implicat, se instaleaza corect bootloaderul pe ambele discuri. Asta ai facut, nu? ;-) Petre. ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: [rlug] Software Raid
Ratiu Petru wrote: Procedura care se foloseste cand vrei sa transformi un sistem din disc simplu in raid1 si n-ai spatiu de backup e asa: 1. bagi discul nou in sistem omu a zis : Ma ajuta cineva cu rezolvarea unei probleme raid? Am facut o clona a unui server prin intreruperea mirror'ului din original si pornirea in clona. . banuiesc ca avea raid si inainte, desi sincer nu pot sa spun ca inteleg perfect ce vrea omu sa zica. Acu presupun si io ca a folosit mdadm si ca are superblockuri (persistente). Ar fi o idee sa scoata din raid partitia cu bube, sa dea zero-superblock, si sa reataseze. poate se repara (in sensu ca d-zeu stie ce o fi facut omul de acum UUID-urile din superblockurile celor doua partitii care ar trebui sa fie in raid sunt diferite, si simptomatica cam asta indica). pt mai multe detalii trimite-ne si noua un : mdadm -E /dev/sdc1; mdadm -E /dev/sdd1; si eventual un mdadm -D /dev/md7 sa vedem si noi ce balarii ai facut de se comporta asa. Dragos * * ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
[rlug] Software Raid
Salutare, Ma ajuta cineva cu rezolvarea unei probleme raid? Am facut o clona a unui server prin intreruperea mirror'ului din original si pornirea in clona. Pe clona totul merge bine in schimb, originalul a capatat o buba ce arata cam asa: md7 : active raid1 sdd1[1] sdc1[0] 293033536 blocks [1/1] [U] Ultimul disc a fost folosit pentru generarea clonei. M'am tot dat pe net incercand sa gasesc o solutie dar nu prea am avut succes. Ceva idei?!?! Cu respect, Mihai P. ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: [rlug] Software Raid
On 6/16/06, Mihai Patru [EMAIL PROTECTED] wrote: Salutare, Ma ajuta cineva cu rezolvarea unei probleme raid? Am facut o clona a unui server prin intreruperea mirror'ului din original si pornirea in clona. Pe clona totul merge bine in schimb, originalul a capatat o buba ce arata cam asa: md7 : active raid1 sdd1[1] sdc1[0] 293033536 blocks [1/1] [U] Scoate discul si baga-l la loc, sa fortezi un rsync: mdadm --remove /dev/md7 /dev/sdc1 mdadm --add /dev/md7 /dev/sdc1 dupa care stai cu geana pe /proc/mdstat sa vezi ca se sincronizeaza. This should be all. Petre. ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug
Re: [rlug] Software Raid
On 6/16/06, Mihai Patru [EMAIL PROTECTED] wrote: Salutare, Ma ajuta cineva cu rezolvarea unei probleme raid? Am facut o clona a unui server prin intreruperea mirror'ului din original si pornirea in clona. Pe clona totul merge bine in schimb, originalul a capatat o buba ce arata cam asa: md7 : active raid1 sdd1[1] sdc1[0] 293033536 blocks [1/1] [U] Ultimul disc a fost folosit pentru generarea clonei. M'am tot dat pe net incercand sa gasesc o solutie dar nu prea am avut succes. Ceva idei?!?! Nu prea inteleg ce-ai facut.. Ai avut un sistem fara raid si ai facut raid clonand la mana o partitie? Sau ai facut un fel de backup duplicand una din partitiile din raid? Ma rog.. in mare parte din cazuri poti sa rezolvi daca scoti partitia din raid si o adaugi la loc.. -- danyvip ___ RLUG mailing list RLUG@lists.lug.ro http://lists.lug.ro/mailman/listinfo/rlug