Re: kswapd meghalt
On Tue, Dec 12, 2006 at 02:41:25PM +0100, Papp Tamas wrote: Probaltad 2.16.19-cel? Bar gondolom xen patch meg nincs ahhoz. A 2.6.19-ben a memoria-kezeles kornyeken van valami bug (illetve van olyan sejtes, hogy a bug mar jo regota ott van, csak eddig nem jott elo), ami file corruption-t okoz. Egyelore meg keresik a hibat, de a Debian sikeresen backportolta a hibat a 2.6.18-ba, szoval jelenleg a Sid-ben levo 2.6.18-3-at sem celszeru elesben hasznalni. Gabor -- - MTA SZTAKI Computer and Automation Research Institute Hungarian Academy of Sciences - _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
On Tue, Dec 19, 2006 at 02:08:32PM +0100, Zoltan NAGY wrote: .1 -ben is? :) Valoszinuleg igen, mert Linus, Andrew es a tobbiek meg javaban vitatkoznak azon, hogy pontosan mi okozza a hibat. Gabor -- - MTA SZTAKI Computer and Automation Research Institute Hungarian Academy of Sciences - _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
Gabor HALASZ wrote: Gabor HALASZ wrote: Gabor Gombas wrote: Ha reprodukalhato, akkor eressz el egy blktrace-t a raid tombre + a tomb minden elemere, es probald ugy megdogleszteni. Stable kernel, ugyhogy ez sem mukodik (2.6.16.35), Annyi haszna volt a debug opciok beforditasanak, hogy sokat logol es magatol ujraindul Tegnap delutan leforditottam debug funkciok nelkul, es igy nem indul ujra. Eloszor a debug funkciokat kellene debugolniuk :-# -- Gabor HALASZ [EMAIL PROTECTED] _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
In article [EMAIL PROTECTED], Gabor Gombas [EMAIL PROTECTED] writes: Ranezesre ez memory corruption, de hogy ki korrumpalta, az ebbol nem derul ki - lehet akar hw, akar sw. Probald meg bekapcsolni a CONFIG_DEBUG_SLAB-ot, futtass memtestet, kerdezd meg a kernel listan (nagyjabol ilyen sorrendben :-) A memtest megfogta. Kosz mindekinek! kissg _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
Papp Tamas wrote: On Tue, Dec 12, 2006 at 10:29:18AM +0100, Gabor HALASZ wrote: Tegnap delutan leforditottam debug funkciok nelkul, es igy nem indul ujra. Eloszor a debug funkciokat kellene debugolniuk :-# Ez ugye nem egy ilyen HG patkolt kernel? Miota nem szabad kernelt patchelni? Es mi koze ennek a kerdeshez? Ugyanaz a kernelforras es a kernel hacking reszt kiveve a konfig is. Szal mi is van benne? Tiszta (vanilla), esetleg mm patch, mi van rajta? 2.6.16.35 + stable xen -- Gabor HALASZ [EMAIL PROTECTED] _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
Papp Tamas wrote: On Tue, Dec 12, 2006 at 12:58:20PM +0100, Gabor HALASZ wrote: Miota nem szabad kernelt patchelni? Es mi koze ennek a kerdeshez? Ugyanaz a kernelforras es a kernel hacking reszt kiveve a konfig is. Az, hogy nem vagy kernel hacker:) Lattam mar sajat ill. mas altal eszkabalt patchet, ami aztan megbolygatta a dolgokat. Ranezesre jo volt. Nem szoktam kernelt eszkabalni, legfeljebb masok altal eszkabalt dolgokat belerakni :) 2.6.16.35 + stable xen Probaltad 2.16.19-cel? Nem, az allanodan valtozo api/abi miatt lenyegeben hasznalhatatlan a 2.6-os tree, a xen-telen gepeimen is 2.6.16-van. Szerencsere a 2.6.16-ot a regi filozofia alapjan tartjak karban, ezert eleg statikus. Bar gondolom xen patch meg nincs ahhoz. Nincs, stabil rendszert nem lehet amorf izekre epiteni. -- Gabor HALASZ [EMAIL PROTECTED] _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
Gabor Gombas wrote: A mellettem levo opteron-os masinan az elebb kerult masolas kozben deadlock-ba az md (iowait 100% a top szerint)Ezek a hibak azonnal megszunnek, amint lehuzom az egyik driveotMindegy melyiket. Ha reprodukalhato, akkor eressz el egy blktrace-t a raid tombre + a tomb minden elemere, es probald ugy megdogleszteni. Erdekes dolgot vettem eszre (mast kerestem, de szemet szurt): a sok diszk kozul az egyikrol azt hiszi, hogy 8M cache van rajta, mig a tobbirol 2M-t gondol, es a 8M-s kinai, mig a tobbi koreai (gondolom garancialis csere miatt). Ez az aprosag ennyire ketsegbe tudja ejteni az md drivert? -- Gabor HALASZ [EMAIL PROTECTED] _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
Gabor HALASZ wrote: Erdekes dolgot vettem eszre (mast kerestem, de szemet szurt): a sok diszk kozul az egyikrol azt hiszi, hogy 8M cache van rajta, mig a tobbirol 2M-t gondol, es a 8M-s kinai, mig a tobbi koreai (gondolom garancialis csere miatt). Ez az aprosag ennyire ketsegbe tudja ejteni az md drivert? kizart dolog. de egyebkent kinek megy ennyire szarul, hogy 2mb cache-s diszkeket tesz szerverbe? :) Udv, Akos _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
2006. december 12. 17.38 dátummal Gábriel Ákos ezt írta: kinek megy ennyire szarul, hogy 2mb cache-s diszkeket tesz szerverbe? :) Jó, tudom, hogy HG-nak szántad, ráadásul viccből mondtad. De pl. mi most éppen egy olyan szervert vittünk ki, amiben tükrözött vinyó is volt, meg még 128MB memória is ;-)) , és 25000 forint volt a vas ;-))) Üdv! -- Vastagh Norbert _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
Gabor Gombas wrote: Ha reprodukalhato, akkor eressz el egy blktrace-t a raid tombre + a tomb minden elemere, es probald ugy megdogleszteni. Stable kernel, ugyhogy ez sem mukodik (2.6.16.35), Majd ha nagyon raerek tovabb patkolom ezt a hulladek kernelpotlekot. -- Gabor HALASZ [EMAIL PROTECTED] _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
On Fri, Dec 08, 2006 at 01:32:49PM +, Kiss Gabor wrote: Code: 48 8b 40 28 48 85 c0 74 06 49 89 c3 41 ff e3 48 89 f7 e9 d2 RIP 80175200{dentry_iput+73} RSP 810037dabdd0 CR2: 00080028 Ha jol tippelek, akkor ez a dcache.c 108-as soraban levo dentry-d_op-d_iput hivatkozas lesz. A d_iput mezo a struct dentry_operations 0x28-as poziciojan van, szoval a legvaloszinubb magyarazat az, hogy a dentry-d_op-d_iput-nak NULL-nak kellett volna lennie, de valami bebillentette a 0x8 bitet, ami miatt a NULL-teszt elbukott. Az ilyen bithiba pedig szinte mindig hw eredetu. Ez az ertek biztosan nem diszkrol jott, szoval a hiba a CPU, memoria, chipset valamelyikeben lesz (esetleg hutesi problema). Gabor -- - MTA SZTAKI Computer and Automation Research Institute Hungarian Academy of Sciences - _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
Kiss Gabor wrote: Ezt ket nap alatt ketszer adta elo. (Illetve a multkor nem tudom mi halt meg, akkor leszakadtam a tavoli geprol.) Van valami ismert hibaja a 2.6.16.19-nek, amiert surgosen le kellene szoknom rola, vagy ez inkabb hardverszagu? (A swap device egy raid0 tomb) Nalam (most eppen) nem csinalja raid1-en, de az md kodot sajnos teljesen osszeganyolta neilbrown. Valoszinuleg hibazik az egyik drive es azt kezeli ilyen egyedi modon, de ez nem annyira a raid0 baja, mert a raid1 eseten elofordulo hdd hibakra is hasonloan reagal. -- Gabor HALASZ [EMAIL PROTECTED] _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
Gabor HALASZ [EMAIL PROTECTED] wrote: kezeli ilyen egyedi modon, de ez nem annyira a raid0 baja, mert a raid1 eseten elofordulo hdd hibakra is hasonloan reagal. ettol fuggetlenul, ha mar tobb diszked van, legyen redundans a swap alatti storage (raid1, raid10, ne pedig raid0...) A backtrace valami kernel bugnak tunik elso ranezesre, de semmit nem zarnek ki. Egyaltalan nem biztos, hogy koze van a swaphez, a kswapd a vm strukturakat buzeralja, ennek csak kis resze a tenyleges paging. raas -- Those who say it cannot be done should not interrupt the person doing it. -- Chinese proverb _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
On Fri, Dec 08, 2006 at 01:32:49PM +, Kiss Gabor wrote: Van valami ismert hibaja a 2.6.16.19-nek, amiert surgosen le kellene szoknom rola, vagy ez inkabb hardverszagu? (A swap device egy raid0 tomb) Ranezesre ez memory corruption, de hogy ki korrumpalta, az ebbol nem derul ki - lehet akar hw, akar sw. Probald meg bekapcsolni a CONFIG_DEBUG_SLAB-ot, futtass memtestet, kerdezd meg a kernel listan (nagyjabol ilyen sorrendben :-) Gabor -- - MTA SZTAKI Computer and Automation Research Institute Hungarian Academy of Sciences - _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
In article [EMAIL PROTECTED], Gabor HALASZ [EMAIL PROTECTED] writes: (A swap device egy raid0 tomb) Nalam (most eppen) nem csinalja raid1-en, de az md kodot sajnos teljesen osszeganyolta neilbrown. Valoszinuleg hibazik az egyik drive es azt kezeli ilyen egyedi modon, de ez nem annyira a raid0 baja, mert a raid1 eseten elofordulo hdd hibakra is hasonloan reagal. Nincs diszkhibara utalo bejegyzes a kern.log-ban. (Sem a dmesg outputjaban.) kissg _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
In article [EMAIL PROTECTED], Andras HORVATH [EMAIL PROTECTED] writes: ettol fuggetlenul, ha mar tobb diszked van, legyen redundans a swap alatti storage (raid1, raid10, ne pedig raid0...) A tobbi volume tokrozve van, de rovid megfontolas utan ugy dontottem, a swap inkabb gyors legyen. kissg _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
Kiss Gabor wrote: In article [EMAIL PROTECTED], Gabor HALASZ [EMAIL PROTECTED] writes: (A swap device egy raid0 tomb) Nalam (most eppen) nem csinalja raid1-en, de az md kodot sajnos teljesen osszeganyolta neilbrown. Valoszinuleg hibazik az egyik drive es azt kezeli ilyen egyedi modon, de ez nem annyira a raid0 baja, mert a raid1 eseten elofordulo hdd hibakra is hasonloan reagal. Nincs diszkhibara utalo bejegyzes a kern.log-ban. (Sem a dmesg outputjaban.) Nem kell fatalis hibara gondolni, eleg, ha a smart korrigalja, maris hanyattesik az md. Mar sok ilyet lattam, csak a flame listara szoktam sirdogalni ezek miatt. Olyanom is van, ahol a remirror kerul deadlockba, ha nyomok egy ctrlaltdel-t, akkor tovabbmegyVan egy par 350G-s diszkem, amin azonnal megall az md, ha bekapcsolom a smart-otA mellettem levo opteron-os masinan az elebb kerult masolas kozben deadlock-ba az md (iowait 100% a top szerint)Ezek a hibak azonnal megszunnek, amint lehuzom az egyik driveotMindegy melyiket. -- Gabor HALASZ [EMAIL PROTECTED] _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
On Fri, Dec 08, 2006 at 03:50:12PM +, Kiss Gabor wrote: A tobbi volume tokrozve van, de rovid megfontolas utan ugy dontottem, a swap inkabb gyors legyen. Akkor csinalj inkabb ket azonos prioritasu swap device-t, es hagyd ki az md-t a jatekbol. Egyel kevesebb hibalehetoseg. Gabor -- - MTA SZTAKI Computer and Automation Research Institute Hungarian Academy of Sciences - _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
In article [EMAIL PROTECTED], Gabor Gombas [EMAIL PROTECTED] writes: A tobbi volume tokrozve van, de rovid megfontolas utan ugy dontottem, a swap inkabb gyors legyen. Akkor csinalj inkabb ket azonos prioritasu swap device-t, es hagyd ki az md-t a jatekbol. Egyel kevesebb hibalehetoseg. Az elszallas utan swapoff -a volt, es igy ment tovabb az afio. Cirka 18 DVD-t kellett volna bemasolnia a HDD-re. Ugy 10 lemezzel kesobb ez is elszallt, ahogy egy sima ls -la is. Szoval nem a swap a lenyeg. A HDD kornyeken lehet a gond. Most reboot. kissg _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
On Fri, Dec 08, 2006 at 05:12:27PM +0100, Gabor HALASZ wrote: Nem kell fatalis hibara gondolni, eleg, ha a smart korrigalja, maris hanyattesik az md. Valami reszlet? Elvileg desktop-grade diszknel lehet az a helyzet, hogy sokaig nyammog a szektor remappelesen, es emiatt a request timeoutra fut, amit az md hard errornak ertekel - tipikus olcso hw-nek hig a leve effektus. Emiatt arul pl. a WD olyan kimondottan RAID-be szant diszket, ami ha torik-ha szakad garantalt idon belul valaszol, igy nem all fenn az ilyen timeout veszelye. Mar sok ilyet lattam, csak a flame listara szoktam sirdogalni ezek miatt. Olyanom is van, ahol a remirror kerul deadlockba, ha nyomok egy ctrlaltdel-t, akkor tovabbmegyVan egy par 350G-s diszkem, amin azonnal megall az md, ha bekapcsolom a smart-ot SZVSZ az nem az md hibaja, hanem a drivere/kontrollere/diszkke/diszk firmware-e. Legfeljebb az md gyorsabban elohozza. A mellettem levo opteron-os masinan az elebb kerult masolas kozben deadlock-ba az md (iowait 100% a top szerint)Ezek a hibak azonnal megszunnek, amint lehuzom az egyik driveotMindegy melyiket. Ha reprodukalhato, akkor eressz el egy blktrace-t a raid tombre + a tomb minden elemere, es probald ugy megdogleszteni. Gabor -- - MTA SZTAKI Computer and Automation Research Institute Hungarian Academy of Sciences - _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
On Fri, Dec 08, 2006 at 04:33:21PM +, Kiss Gabor wrote: Ugy 10 lemezzel kesobb ez is elszallt, ahogy egy sima ls -la is. Szoval nem a swap a lenyeg. A HDD kornyeken lehet a gond. Annak nagy valoszinuseggel nyoma kell, hogy legyen a kernel logban, I/O hibak formajaban. Most reboot. memtest... Gabor -- - MTA SZTAKI Computer and Automation Research Institute Hungarian Academy of Sciences - _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
In article [EMAIL PROTECTED], Gabor Gombas [EMAIL PROTECTED] writes: Ugy 10 lemezzel kesobb ez is elszallt, ahogy egy sima ls -la is. Szoval nem a swap a lenyeg. A HDD kornyeken lehet a gond. Annak nagy valoszinuseggel nyoma kell, hogy legyen a kernel logban, I/O hibak formajaban. Nem feltetlenul HW hiba. Az ide.c is lehet ocska. Most reboot. memtest... A varos masik vegen vagyok. De van mellette valaki, akit taviranyitok. :-) Majd ejszakara elinditja. kissg _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux
Re: kswapd meghalt
On Fri, Dec 08, 2006 at 04:57:01PM +, Kiss Gabor wrote: Nem feltetlenul HW hiba. Az ide.c is lehet ocska. Az nem lehet, hanem biztos :-) De szemely szerint nem tartom valoszinunek, hogy jelen esetben azzal legyen a gond (epp azert, mert az IDE kod mar regota nem valtozik, kicsi az eselye, hogy ilyen jellegu hiba legyen benne. Ha megis, akkor ki lehet probalni a libata-t). Gabor -- - MTA SZTAKI Computer and Automation Research Institute Hungarian Academy of Sciences - _ linux lista - linux@mlf.linux.rulez.org http://mlf2.linux.rulez.org/mailman/listinfo/linux