2009/5/28 Gabor HALASZ <halas...@freemail.hu>:
> Azt irtad, hogy lehal vagy elpanikol. Innen folytassuk a gondolatmenetet.

Nem jól fogalmazott. A cluster élő node-jai azt látják, hogy a kiesett
node nem csinálja azt, amit csinálnia kellene (pl. alive üzenetek
küldése, valami megosztott erőforrás írása, pingelés stb.) Ilyenkor
két eset lehetséges:
- ha tényleg elpánikolt a kiesett node, akkor nem ártunk vele, ha újraindítjuk
- ha nem pánikolt el, hanem meghülyült, és pl. azt hiszi, hogy ő az
egyetlen megmaradt node a clusterben és magához veszi a cluster összes
IP-címét, akkor használunk vele, ha újraindítjuk.

>> Kiveve ha atmeneti hibarol van szo (elszalad valamelyik processzel a
>> lo[ad], ezert nem reagal),
> Atmeneti hiba nincs, csak a linuxosok utik el ezzel a minosithetetlen
> softwareiket.

De van. Ha elpánikol egy node és sikeresen újraindítjuk, akkor az pl.
a cluster szemszögéből nézve átmeneti hiba.

> Megegyszer: nincs olyan, hogy egy leallt/kitiltott node magatol
> visszater a clusterbe. Illetve linuxon van, ezzel boritottam ossze a
> csodalatos gfs-t.

De igen, van ilyen, ez működőképes. Lehet, hogy gfs-sel és RHCS-sel
nem működik, nem tudom, de az elv működőképes.

>>> De ezzel egyutt, ez mennyiben erinti a cluster rendelkezesre allasat?
>> Quorum?
> Hatarozatkepesseg? Nem lehetne egyszavas visszakerdezes helyett leirni,
> mit akarsz? A flame-en utalom, de ez meg csak nem is a flame lista.

Ha van egy sok node-os clustered és az "ketté szakad" (azaz a node-ok
egy része csak egymást látja, a node-ok egy másik része pedig szintén
csak egymást látja), akkor valamilyen módon el kell dönteni, hogy
melyik fél akarja magához ragadni az erőforrásokat (pl. az
IP-címeket).

Ezt meg lehet pl. oldani úgy, hogy az egyes node-okhoz egyenlő
nagyságú súlyokat rendelünk. Amikor a szétszakadás megtörténik, akkor
az egyes paríciókban lévő súlyokat összeadjuk, és kijelentjük, hogy
amelyik partíciónál a súlyoknak több, mint a fele van, az nyert.
Amelyik félnél több súly van, az felveszi az IP-címeket, amelyinél
kevés van, az eldobálja.

Persze lehet cifrázni az algoritmust, pl. két node esetén az (1, 2)
súlyokat alkalmazni, 10 node esetén 1 node-nak 2-es, minden más
node-nak 1-es súlyt adni, sőt, megfelelő súlyválasztással és a
"határozatképesség" szintjének megfelelő beállításával lehet kezelni
pl. több részre szakadó clustereket is.

Ha érdekel részletesebben a téma, akkor ülj be egy kicsit a BME-re
ezekre az órákra:

https://www.vik.bme.hu/kepzes/targyak/VIMM4324/
-- 
Zizi

- Mindig így fogsz szeretni?
- Mindig. Csak nem mindig téged.
_________________________________________________
linux lista      -      linux@mlf.linux.rulez.org
http://mlf2.linux.rulez.org/mailman/listinfo/linux

válasz