[ITCENTER] Re: Linux Clustering

2006-06-21 Terurut Topik syiwabhairawa
--- In ITCENTER@yahoogroups.com, Herawan Husin [EMAIL PROTECTED] wrote:

 Temans semua,
 ma'af mau nanya, ada yg sdh pernah implementasi clustering pake
Linux gak?
 yg ditanyakan, menggunakan aplikasi apa aja (spt yg punya fujitsu
 primecluster) dan hardwarenya apa aja. Kesulitannya gimana (khabarnya
 tingkat kesulitannya berkali2 lipat dr instalasi biasa).
 dan apa yg mesti dperhatikan dsb. thanks

Definisi cluster ini ada 3 macam :
1. Failover cluster, dimana mesin A menggantikan otomatis mesin B yg
down. A dan B tidak berkerja secara bersama tapi bergantian
2. Paralel cluster, dimana mesin A dan B berkerja sama mengolah data
yang sama bersamaan, bahkan bisa ditambahkan jadi lebih dari 2 nodes
3. High Performance Computing cluster/Massively Paralel Processing,
dimana puluhan, ratusan, atau ribuan computer melakukan computation
floating point independent untuk menghitung matrix besar.

Nah anda kepingin yang mana?
Karena anda mention Primecluster, berarti antara 1 dan 2

Kemudian data service yg ingin di-cluster itu apa? Database server,
File server, DNS server, LDAP server, Web server?

Kelemahan di Linux adalah kebanyakan proyek digunakan untuk cluster
jenis ke 3, dan tidak standardnya hardware maupun software API untuk
mewujudkannya. Dulu Compaq sebelum dibeli HP biasa membundel Steeleye
Livekeeper untuk Linux, tapi setelah di beli sama HP jadi kurang jelas
informasinya. biasanya digunakan untuk jenis cluster no 1

Yg barusan saya coba adalah Oracle 10g RAC pakai Linux, ini jenis
cluster no 2.






-- 
www.itcenter.or.id - Komunitas Teknologi Informasi Indonesia 
Info, Gabung, Keluar, Mode Kirim : [EMAIL PROTECTED] 
:: Hapus bagian yang tidak perlu (footer, dst) saat reply! :: 
## Jobs: itcenter.or.id/jobs ## Bursa: itcenter.or.id/bursa ##
$$ Iklan/promosi : www.itcenter.or.id/sponsorship $$

[@@] Jaket ITCENTER tersedia di http://shop.itcenter.or.id 

 
Yahoo! Groups Links

* To visit your group on the web, go to:
http://groups.yahoo.com/group/ITCENTER/

* To unsubscribe from this group, send an email to:
[EMAIL PROTECTED]

* Your use of Yahoo! Groups is subject to:
http://docs.yahoo.com/info/terms/
 





Re: [ITCENTER] Re: Linux Clustering

2006-06-21 Terurut Topik Herawan Husin
benar mas,
yg saya maksud belum sampai HPC Cluster tapi masih di no.2 Paralel cluster
(tapi bukankah ini jg bisa dibilang HPC mas?).
hmmm untuk data service yg akan di cluster ini hanya bisa salah satunya atau
bisa lebih dari satu, database server dan web server.

Wah kebetulan lagi saya masih mempelajari RAC ini mas, share yah mas please.
Dan saya pikir pengetahuan ini adalah hal yg berharga bg ITers yg lain,
karena kedepannya mungkin akan lebih mengarah ke sini yah utk performance
server 24hours/day. Server proc xeon kan udh kejangkau.:)

Boleh dijelaskan gak mas, apa yg mesti diperhatikan dr hardware yg support
utk hal ini sampai tahap implementasinya step by step.

thanks :)

rgds



On 6/21/06, syiwabhairawa [EMAIL PROTECTED] wrote:

 --- In ITCENTER@yahoogroups.com, Herawan Husin [EMAIL PROTECTED] wrote:
 
  Temans semua,
  ma'af mau nanya, ada yg sdh pernah implementasi clustering pake
 Linux gak?
  yg ditanyakan, menggunakan aplikasi apa aja (spt yg punya fujitsu
  primecluster) dan hardwarenya apa aja. Kesulitannya gimana (khabarnya
  tingkat kesulitannya berkali2 lipat dr instalasi biasa).
  dan apa yg mesti dperhatikan dsb. thanks

 Definisi cluster ini ada 3 macam :
 1. Failover cluster, dimana mesin A menggantikan otomatis mesin B yg
 down. A dan B tidak berkerja secara bersama tapi bergantian
 2. Paralel cluster, dimana mesin A dan B berkerja sama mengolah data
 yang sama bersamaan, bahkan bisa ditambahkan jadi lebih dari 2 nodes
 3. High Performance Computing cluster/Massively Paralel Processing,
 dimana puluhan, ratusan, atau ribuan computer melakukan computation
 floating point independent untuk menghitung matrix besar.

 Nah anda kepingin yang mana?
 Karena anda mention Primecluster, berarti antara 1 dan 2

 Kemudian data service yg ingin di-cluster itu apa? Database server,
 File server, DNS server, LDAP server, Web server?

 Kelemahan di Linux adalah kebanyakan proyek digunakan untuk cluster
 jenis ke 3, dan tidak standardnya hardware maupun software API untuk
 mewujudkannya. Dulu Compaq sebelum dibeli HP biasa membundel Steeleye
 Livekeeper untuk Linux, tapi setelah di beli sama HP jadi kurang jelas
 informasinya. biasanya digunakan untuk jenis cluster no 1

 Yg barusan saya coba adalah Oracle 10g RAC pakai Linux, ini jenis
 cluster no 2.






 --
 www.itcenter.or.id - Komunitas Teknologi Informasi Indonesia
 Info, Gabung, Keluar, Mode Kirim : [EMAIL PROTECTED]
 :: Hapus bagian yang tidak perlu (footer, dst) saat reply! ::
 ## Jobs: itcenter.or.id/jobs ## Bursa: itcenter.or.id/bursa ##
 $$ Iklan/promosi : www.itcenter.or.id/sponsorship $$

 [@@] Jaket ITCENTER tersedia di http://shop.itcenter.or.id


 Yahoo! Groups Links










[Non-text portions of this message have been removed]






-- 
www.itcenter.or.id - Komunitas Teknologi Informasi Indonesia 
Info, Gabung, Keluar, Mode Kirim : [EMAIL PROTECTED] 
:: Hapus bagian yang tidak perlu (footer, dst) saat reply! :: 
## Jobs: itcenter.or.id/jobs ## Bursa: itcenter.or.id/bursa ##
$$ Iklan/promosi : www.itcenter.or.id/sponsorship $$

[@@] Jaket ITCENTER tersedia di http://shop.itcenter.or.id 

 
Yahoo! Groups Links

* To visit your group on the web, go to:
http://groups.yahoo.com/group/ITCENTER/

* To unsubscribe from this group, send an email to:
[EMAIL PROTECTED]

* Your use of Yahoo! Groups is subject to:
http://docs.yahoo.com/info/terms/
 




Re: [ITCENTER] Re: Linux Clustering

2006-06-21 Terurut Topik The_Eye_In_The_Sky
Herawan Husin wrote:
 
 
 benar mas,
 yg saya maksud belum sampai HPC Cluster tapi masih di no.2 Paralel cluster
 (tapi bukankah ini jg bisa dibilang HPC mas?).

Saya keliru memberikan penamaan di no 2, seharusnya Load balancing 
cluster. Memang dia paralel, tapi biasanya di load balancing server, 
masing masing node mengakses data yang sama dan sama sama tahu kalau 
another node melakukan perubahan. Ini dinamakan shared paralel cluster. 
Bisa shared everything (sampai ke sisi memory masing masing node), bisa 
  hanya shared storage. Oracle RAC ada di level shared storage, tapi dia 
punya utility cache fusion, Sedangkan dalam HPC/MPP, mesin mesin itu 
semata mata melakukan distributed computing, tanpa perlu tahu apa yang 
dilakukan oleh node lain. Ini mengandalkan pada metoda numerik yang 
memecahkan complex equation ke dalam discrete computation yang 
independent satu sama lain. Ini dimnamakan juga shared nothing architecture.

 hmmm untuk data service yg akan di cluster ini hanya bisa salah satunya atau
 bisa lebih dari satu, database server dan web server.

Memang selama ini obyek yang relative make sense untuk dibuat scalable 
di dunia business computing adalah web dan database. Web sendiri 
sebetulnya bisa dibuat tanpa cluster framework, karena kita bisa 
menggunakan load balancer. Bahkan cluster framework yg ada pun 
kerjaannya sebetulnya hanya doing load balancing, dan memastikan bahwa 
client dari luar, misakan client X, yang masuk ke node cluster A, akan 
diservice oleh node A terus. Kalo enggak kan bisa berantakan requestnya. 
Baru kalau node A mati, dia dipindah ke node B. Komunikasi antara node 
dalam paralel web server tidak banyak, jadi relatively independent.

Sedangkan database server, selain membagi load, juga melakukan akses 
data yang sama dalam disk yang dibagi bersama. Selama ini saya lihat 
hanya Oracle yg punya solusi feasible untuk ini, dengan produknya Oracle 
OPS/RAC. Karena sekarang belum ada file system yg bisa dibaca 
berbarengan oleh multi node (ada sih, seperti Sun QFS, tapi mahal pisan 
dan hanya dicertified untuk Sun Cluster), maka aksesnya dilakukan secara 
raw, dan Oracle RAC menyedikan Unix Dynamic Lock Manager, daemon yg 
memonitor interlock write antar node. Selain itu ORacle RAC juga kudu 
menyediakan cara untuk melakukan cache coherency, jadi jika suatu data 
di storage diubah oleh suatu node, semua cache di semua nodes yg 
mereferensikan data tersebut kudu diflush karena tidak valid lagi. Kedua 
feature ini mensyaratkan adanya cluster interconnect yang punya 
kecepatan tinggi.

 
 Wah kebetulan lagi saya masih mempelajari RAC ini mas, share yah mas please.
 Dan saya pikir pengetahuan ini adalah hal yg berharga bg ITers yg lain,
 karena kedepannya mungkin akan lebih mengarah ke sini yah utk performance
 server 24hours/day. Server proc xeon kan udh kejangkau.:)

Untuk performane 24x7 alias mission critical ini sebetulnya berapa sih 
allowable downtimenya? Selama ini di Indonesia yang butuh banget adalah 
perusahaan telco, dan mereka masih OK untu 99,99% uptime. Mungkin kalau 
startup databasenya cepat, anda belum tentu butuh Oracle RAC. Oracle HA
yg pakai failover mode juga kadang lebih mudah disetup dan di-maintain.

Kemudian untuk processor, saya sarankan daripada pakai Xeon, lebih baik 
pakai AMD64, karena :
1. lebih hemat power. Ini biar kecil, tapi kalo jumlah nodenyanya 48 
biji, bisa besar efeknya.
2. kecil, sehingga muat di 1U server, inget, data centre space itu mahal.
3. jelas jelas pelopor 64 bit computing, Xeon kan cuman ngekor dengan 
EMT64-nya
4. murah :D

 Boleh dijelaskan gak mas, apa yg mesti diperhatikan dr hardware yg support
 utk hal ini sampai tahap implementasinya step by step.

Kalau dari hardware :
1. Butuh computer biasa saja, terserah mau single processor atau mau SMP
2. Butuh cluster interconnect. Kalau mau murah, pakai Gigabit Ethernet. 
Tapi masalah GE ini kan DLPI device, jadi boros overhead di DLPI stack, 
IRQ servicing, Serializer-Deserializer etc. Akibatnya biar throughput 
besar, latency juga besar karena banyak pihak yg dilewatkan dalam jalur 
transimisinya. Yg bagus untuk Oracle RAC adalah Resource Shared Memory 
interface yang langsung melakukan mapping sebagian memory dari suatu 
node ke node lain. Untuk dunia x86, yang terkenal adalah Myrinet. Untuk 
dunia *nix yang saya tahu adalah Scalable Coherent Interface dari Sun, 
dan Hyper-Fabric dari HP. SGI dulu juga punya Craylink Interconnect 
untuk NUMA, tapi berhubung udah tewas, gak usah dibahas deh. Alternatif 
lain adalah Veritas Advanced Cluster, dia punya special driver 
menggantikan DLPI, jadi bisa menggunakan GE dengan latency yg lebih 
rendah. Alternatif lain yang tidak proprietary dan cocok buat siapa saja 
adalah InfiniBand Host Channel Adapter, saya lihat harganya juga sudah 
di bawah US$1000.
3. Butuh shared storage yang LUN-nya bisa diakses banyak node. Nah ini 
jelas, kudu pakai SAN. Kalo storagenya punya multiple FC output dan LUN 
yg sama bisa dimap ke multile port,