Re: kswapd meghalt

2006-12-19 bef zés Gabor Gombas
On Tue, Dec 12, 2006 at 02:41:25PM +0100, Papp Tamas wrote:

 Probaltad 2.16.19-cel? Bar gondolom xen patch meg nincs ahhoz.

A 2.6.19-ben a memoria-kezeles kornyeken van valami bug (illetve van
olyan sejtes, hogy a bug mar jo regota ott van, csak eddig nem jott
elo), ami file corruption-t okoz. Egyelore meg keresik a hibat, de a
Debian sikeresen backportolta a hibat a 2.6.18-ba, szoval jelenleg a
Sid-ben levo 2.6.18-3-at sem celszeru elesben hasznalni.

Gabor

-- 
 -
 MTA SZTAKI Computer and Automation Research Institute
Hungarian Academy of Sciences
 -
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-19 bef zés Gabor Gombas
On Tue, Dec 19, 2006 at 02:08:32PM +0100, Zoltan NAGY wrote:

 .1 -ben is? :)

Valoszinuleg igen, mert Linus, Andrew es a tobbiek meg javaban
vitatkoznak azon, hogy pontosan mi okozza a hibat.

Gabor

-- 
 -
 MTA SZTAKI Computer and Automation Research Institute
Hungarian Academy of Sciences
 -
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-12 bef zés Gabor HALASZ
Gabor HALASZ wrote:
 Gabor HALASZ wrote:
 
Gabor Gombas wrote:


Ha reprodukalhato, akkor eressz el egy blktrace-t a raid tombre + a tomb
minden elemere, es probald ugy megdogleszteni.



Stable  kernel, ugyhogy ez sem mukodik (2.6.16.35),
 
 
 Annyi haszna volt a debug opciok beforditasanak, hogy sokat logol es 
 magatol ujraindul
 
 
Tegnap delutan leforditottam debug funkciok nelkul, es igy nem indul 
ujra. Eloszor a debug funkciokat kellene debugolniuk :-#

-- 
Gabor HALASZ [EMAIL PROTECTED]
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-12 bef zés Kiss Gabor

In article [EMAIL PROTECTED],
Gabor Gombas [EMAIL PROTECTED] writes:
 Ranezesre ez memory corruption, de hogy ki korrumpalta, az ebbol nem
 derul ki - lehet akar hw, akar sw.  Probald meg bekapcsolni a
 CONFIG_DEBUG_SLAB-ot, futtass memtestet, kerdezd meg a kernel listan
 (nagyjabol ilyen sorrendben :-)

A memtest megfogta.
Kosz mindekinek!

kissg
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-12 bef zés Gabor HALASZ
Papp Tamas wrote:
 On Tue, Dec 12, 2006 at 10:29:18AM +0100, Gabor HALASZ wrote:
 
Tegnap delutan leforditottam debug funkciok nelkul, es igy nem indul 
ujra. Eloszor a debug funkciokat kellene debugolniuk :-#
 
 
 Ez ugye nem egy ilyen HG patkolt kernel?

Miota nem szabad kernelt patchelni? Es mi koze ennek a kerdeshez?
Ugyanaz a kernelforras es a kernel hacking reszt kiveve a konfig is.

 Szal mi is van benne? Tiszta
 (vanilla), esetleg mm patch, mi van rajta?
 

2.6.16.35 + stable xen



-- 
Gabor HALASZ [EMAIL PROTECTED]
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-12 bef zés Gabor HALASZ
Papp Tamas wrote:
 On Tue, Dec 12, 2006 at 12:58:20PM +0100, Gabor HALASZ wrote:
 
Miota nem szabad kernelt patchelni? Es mi koze ennek a kerdeshez?
Ugyanaz a kernelforras es a kernel hacking reszt kiveve a konfig is.
 
 
 Az, hogy nem vagy kernel hacker:)
 
 Lattam mar sajat ill. mas altal eszkabalt patchet, ami aztan
 megbolygatta a dolgokat. Ranezesre jo volt.
 

Nem szoktam kernelt eszkabalni, legfeljebb masok altal eszkabalt 
dolgokat belerakni :)

 
2.6.16.35 + stable xen
 
 
 Probaltad 2.16.19-cel?

Nem, az allanodan valtozo api/abi miatt lenyegeben hasznalhatatlan a 
2.6-os tree, a xen-telen gepeimen is 2.6.16-van.
Szerencsere a 2.6.16-ot a regi filozofia alapjan tartjak karban, ezert 
eleg statikus.

 
 Bar gondolom xen patch meg nincs ahhoz.
 

Nincs, stabil rendszert nem lehet amorf izekre epiteni.

-- 
Gabor HALASZ [EMAIL PROTECTED]
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-12 bef zés Gabor HALASZ
Gabor Gombas wrote:
 
A mellettem levo opteron-os masinan az elebb kerult masolas kozben
deadlock-ba az md (iowait 100% a top szerint)Ezek a hibak azonnal
megszunnek, amint lehuzom az egyik driveotMindegy melyiket.
 
 
 Ha reprodukalhato, akkor eressz el egy blktrace-t a raid tombre + a tomb
 minden elemere, es probald ugy megdogleszteni.
 
Erdekes dolgot vettem eszre (mast kerestem, de szemet szurt): a sok 
diszk kozul az egyikrol azt hiszi, hogy 8M cache van rajta, mig a 
tobbirol 2M-t gondol, es a 8M-s kinai, mig a tobbi koreai (gondolom 
garancialis csere miatt). Ez az aprosag ennyire ketsegbe tudja ejteni az 
md drivert?

-- 
Gabor HALASZ [EMAIL PROTECTED]
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-12 bef zés Gábriel Ákos
Gabor HALASZ wrote:
 Erdekes dolgot vettem eszre (mast kerestem, de szemet szurt): a sok 
 diszk kozul az egyikrol azt hiszi, hogy 8M cache van rajta, mig a 
 tobbirol 2M-t gondol, es a 8M-s kinai, mig a tobbi koreai (gondolom 
 garancialis csere miatt). Ez az aprosag ennyire ketsegbe tudja ejteni az 
 md drivert?

kizart dolog. de egyebkent kinek megy ennyire szarul, hogy 2mb cache-s
diszkeket tesz szerverbe? :)

Udv,
Akos

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-12 bef zés Vastagh Norbert
2006. december 12. 17.38 dátummal Gábriel Ákos ezt írta:
  kinek megy ennyire szarul, hogy 2mb cache-s diszkeket tesz
  szerverbe? :) 

Jó, tudom, hogy HG-nak szántad, ráadásul viccből mondtad.
De pl. mi most éppen egy olyan szervert vittünk ki, amiben tükrözött 
vinyó is volt, meg még 128MB memória is ;-)) , és 25000 forint volt 
a vas ;-)))

Üdv!

-- 
Vastagh Norbert
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

Re: kswapd meghalt

2006-12-11 bef zés Gabor HALASZ
Gabor Gombas wrote:
 
 
 Ha reprodukalhato, akkor eressz el egy blktrace-t a raid tombre + a tomb
 minden elemere, es probald ugy megdogleszteni.
 

Stable  kernel, ugyhogy ez sem mukodik (2.6.16.35), Majd ha nagyon 
raerek tovabb patkolom ezt a hulladek kernelpotlekot.


-- 
Gabor HALASZ [EMAIL PROTECTED]
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-09 bef zés Gabor Gombas
On Fri, Dec 08, 2006 at 01:32:49PM +, Kiss Gabor wrote:

 Code: 48 8b 40 28 48 85 c0 74 06 49 89 c3 41 ff e3 48 89 f7 e9 d2 
 RIP 80175200{dentry_iput+73} RSP 810037dabdd0
 CR2: 00080028

Ha jol tippelek, akkor ez a dcache.c 108-as soraban levo
dentry-d_op-d_iput hivatkozas lesz. A d_iput mezo a struct
dentry_operations 0x28-as poziciojan van, szoval a legvaloszinubb
magyarazat az, hogy a dentry-d_op-d_iput-nak NULL-nak kellett volna
lennie, de valami bebillentette a 0x8 bitet, ami miatt a NULL-teszt
elbukott. Az ilyen bithiba pedig szinte mindig hw eredetu. Ez az ertek
biztosan nem diszkrol jott, szoval a hiba a CPU, memoria, chipset
valamelyikeben lesz (esetleg hutesi problema).

Gabor

-- 
 -
 MTA SZTAKI Computer and Automation Research Institute
Hungarian Academy of Sciences
 -
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Gabor HALASZ
Kiss Gabor wrote:
  
 Ezt ket nap alatt ketszer adta elo.
 (Illetve a multkor nem tudom mi halt meg, akkor leszakadtam
 a tavoli geprol.)
 
 Van valami ismert hibaja a 2.6.16.19-nek, amiert surgosen
 le kellene szoknom rola, vagy ez inkabb hardverszagu?
 (A swap device egy raid0 tomb)

Nalam (most eppen) nem csinalja raid1-en, de az md kodot sajnos teljesen 
osszeganyolta neilbrown. Valoszinuleg hibazik az egyik drive es azt 
kezeli ilyen egyedi modon, de ez nem annyira a raid0 baja, mert a raid1 
eseten elofordulo hdd hibakra is hasonloan reagal.

-- 
Gabor HALASZ [EMAIL PROTECTED]
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Andras HORVATH

Gabor HALASZ [EMAIL PROTECTED] wrote:

 kezeli ilyen egyedi modon, de ez nem annyira a raid0 baja, mert a raid1 
 eseten elofordulo hdd hibakra is hasonloan reagal.

ettol fuggetlenul, ha mar tobb diszked van, legyen redundans a swap
alatti storage (raid1, raid10, ne pedig raid0...)

A backtrace valami kernel bugnak tunik elso ranezesre, de semmit nem
zarnek ki. Egyaltalan nem biztos, hogy koze van a swaphez, a kswapd a
vm strukturakat buzeralja, ennek csak kis resze a tenyleges paging.

raas
-- 
Those who say it cannot be done should not interrupt the person doing it.
   -- Chinese proverb

_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Gabor Gombas
On Fri, Dec 08, 2006 at 01:32:49PM +, Kiss Gabor wrote:

 Van valami ismert hibaja a 2.6.16.19-nek, amiert surgosen
 le kellene szoknom rola, vagy ez inkabb hardverszagu?
 (A swap device egy raid0 tomb)

Ranezesre ez memory corruption, de hogy ki korrumpalta, az ebbol nem
derul ki - lehet akar hw, akar sw.  Probald meg bekapcsolni a
CONFIG_DEBUG_SLAB-ot, futtass memtestet, kerdezd meg a kernel listan
(nagyjabol ilyen sorrendben :-)

Gabor

-- 
 -
 MTA SZTAKI Computer and Automation Research Institute
Hungarian Academy of Sciences
 -
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Kiss Gabor

In article [EMAIL PROTECTED],
Gabor HALASZ [EMAIL PROTECTED] writes:
 (A swap device egy raid0 tomb)
 
 Nalam (most eppen) nem csinalja raid1-en, de az md kodot sajnos teljesen 
 osszeganyolta neilbrown. Valoszinuleg hibazik az egyik drive es azt 
 kezeli ilyen egyedi modon, de ez nem annyira a raid0 baja, mert a raid1 
 eseten elofordulo hdd hibakra is hasonloan reagal.

Nincs diszkhibara utalo bejegyzes a kern.log-ban.
(Sem a dmesg outputjaban.)

kissg
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Kiss Gabor

In article [EMAIL PROTECTED],
Andras HORVATH [EMAIL PROTECTED] writes:
 ettol fuggetlenul, ha mar tobb diszked van, legyen redundans a swap
 alatti storage (raid1, raid10, ne pedig raid0...)

A tobbi volume tokrozve van, de rovid megfontolas utan
ugy dontottem, a swap inkabb gyors legyen.

kissg
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Gabor HALASZ
Kiss Gabor wrote:
 In article [EMAIL PROTECTED],
   Gabor HALASZ [EMAIL PROTECTED] writes:
 
(A swap device egy raid0 tomb)

Nalam (most eppen) nem csinalja raid1-en, de az md kodot sajnos teljesen 
osszeganyolta neilbrown. Valoszinuleg hibazik az egyik drive es azt 
kezeli ilyen egyedi modon, de ez nem annyira a raid0 baja, mert a raid1 
eseten elofordulo hdd hibakra is hasonloan reagal.
 
 
 Nincs diszkhibara utalo bejegyzes a kern.log-ban.
 (Sem a dmesg outputjaban.)
 

Nem kell fatalis hibara gondolni, eleg, ha a smart korrigalja, maris 
hanyattesik az md. Mar sok ilyet lattam, csak a flame listara szoktam 
sirdogalni ezek miatt. Olyanom is van, ahol a remirror kerul deadlockba, 
ha nyomok egy ctrlaltdel-t, akkor tovabbmegyVan egy par 350G-s 
diszkem, amin azonnal megall az md, ha bekapcsolom a smart-otA 
mellettem levo opteron-os masinan az elebb kerult masolas kozben 
deadlock-ba az md (iowait 100% a top szerint)Ezek a hibak azonnal 
megszunnek, amint lehuzom az egyik driveotMindegy melyiket.

-- 
Gabor HALASZ [EMAIL PROTECTED]
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Gabor Gombas
On Fri, Dec 08, 2006 at 03:50:12PM +, Kiss Gabor wrote:

 A tobbi volume tokrozve van, de rovid megfontolas utan
 ugy dontottem, a swap inkabb gyors legyen.

Akkor csinalj inkabb ket azonos prioritasu swap device-t, es hagyd ki az
md-t a jatekbol. Egyel kevesebb hibalehetoseg.

Gabor

-- 
 -
 MTA SZTAKI Computer and Automation Research Institute
Hungarian Academy of Sciences
 -
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Kiss Gabor

In article [EMAIL PROTECTED],
Gabor Gombas [EMAIL PROTECTED] writes:
 A tobbi volume tokrozve van, de rovid megfontolas utan
 ugy dontottem, a swap inkabb gyors legyen.
 
 Akkor csinalj inkabb ket azonos prioritasu swap device-t, es hagyd ki az
 md-t a jatekbol. Egyel kevesebb hibalehetoseg.

Az elszallas utan swapoff -a volt,
es igy ment tovabb az afio.
Cirka 18 DVD-t kellett volna bemasolnia a HDD-re.
Ugy 10 lemezzel kesobb ez is elszallt, ahogy egy sima ls -la is.
Szoval nem a swap a lenyeg. A HDD kornyeken lehet a gond.

Most reboot.

kissg
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Gabor Gombas
On Fri, Dec 08, 2006 at 05:12:27PM +0100, Gabor HALASZ wrote:

 Nem kell fatalis hibara gondolni, eleg, ha a smart korrigalja, maris 
 hanyattesik az md.

Valami reszlet? Elvileg desktop-grade diszknel lehet az a helyzet, hogy
sokaig nyammog a szektor remappelesen, es emiatt a request timeoutra
fut, amit az md hard errornak ertekel - tipikus olcso hw-nek hig a
leve effektus. Emiatt arul pl. a WD olyan kimondottan RAID-be szant
diszket, ami ha torik-ha szakad garantalt idon belul valaszol, igy nem
all fenn az ilyen timeout veszelye.

 Mar sok ilyet lattam, csak a flame listara szoktam 
 sirdogalni ezek miatt. Olyanom is van, ahol a remirror kerul deadlockba, 
 ha nyomok egy ctrlaltdel-t, akkor tovabbmegyVan egy par 350G-s 
 diszkem, amin azonnal megall az md, ha bekapcsolom a smart-ot

SZVSZ az nem az md hibaja, hanem a drivere/kontrollere/diszkke/diszk
firmware-e. Legfeljebb az md gyorsabban elohozza.

 A mellettem levo opteron-os masinan az elebb kerult masolas kozben
 deadlock-ba az md (iowait 100% a top szerint)Ezek a hibak azonnal
 megszunnek, amint lehuzom az egyik driveotMindegy melyiket.

Ha reprodukalhato, akkor eressz el egy blktrace-t a raid tombre + a tomb
minden elemere, es probald ugy megdogleszteni.

Gabor

-- 
 -
 MTA SZTAKI Computer and Automation Research Institute
Hungarian Academy of Sciences
 -
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Gabor Gombas
On Fri, Dec 08, 2006 at 04:33:21PM +, Kiss Gabor wrote:

 Ugy 10 lemezzel kesobb ez is elszallt, ahogy egy sima ls -la is.
 Szoval nem a swap a lenyeg. A HDD kornyeken lehet a gond.

Annak nagy valoszinuseggel nyoma kell, hogy legyen a kernel logban, I/O
hibak formajaban.

 Most reboot.

memtest...

Gabor

-- 
 -
 MTA SZTAKI Computer and Automation Research Institute
Hungarian Academy of Sciences
 -
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Kiss Gabor

In article [EMAIL PROTECTED],
Gabor Gombas [EMAIL PROTECTED] writes:
 Ugy 10 lemezzel kesobb ez is elszallt, ahogy egy sima ls -la is.
 Szoval nem a swap a lenyeg. A HDD kornyeken lehet a gond.
 
 Annak nagy valoszinuseggel nyoma kell, hogy legyen a kernel logban, I/O
 hibak formajaban.

Nem feltetlenul HW hiba.
Az ide.c is lehet ocska.

 Most reboot.
 
 memtest...

A varos masik vegen vagyok.
De van mellette valaki, akit taviranyitok. :-)
Majd ejszakara elinditja.

kissg
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux


Re: kswapd meghalt

2006-12-08 bef zés Gabor Gombas
On Fri, Dec 08, 2006 at 04:57:01PM +, Kiss Gabor wrote:

 Nem feltetlenul HW hiba.
 Az ide.c is lehet ocska.

Az nem lehet, hanem biztos :-) De szemely szerint nem tartom
valoszinunek, hogy jelen esetben azzal legyen a gond (epp azert, mert az
IDE kod mar regota nem valtozik, kicsi az eselye, hogy ilyen jellegu
hiba legyen benne. Ha megis, akkor ki lehet probalni a libata-t).

Gabor

-- 
 -
 MTA SZTAKI Computer and Automation Research Institute
Hungarian Academy of Sciences
 -
_
linux lista  -  linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux