Original Sender : "ifan" <[EMAIL PROTECTED]>
---------------------------------
>OS : "Y. Ignatius Erik Arya" <[EMAIL PROTECTED]>
>---------------------------------
>Dari step diatas kelihatan bahwa semakin sedikit level
>cache yang ada, semakin sedikit waktu tunda yang
>diperlukan jika terjadi "Miss Hit".
::------------------------------
Huehehe.. pengertiannya udah oke nih.. cuman ada satu hal
yang kadang kita lupa.. processor kan nggak cuman ngurusin
flow data doang.. dia juga nanganin request interrupt dari
peripheral.. dan ini kerjanya bergantian.. jadi waktu
idle-nya cpu sebetulnya berat di banyaknya request dan
operasi aritmatika.. sedangkan flow datanya biasanya sudah
berbentuk sequensial.. jadi tinggal diurus sama L1 dan L2
cachenya.. data masuk ke L2 dalam bentuk sequensial row,
clocknya bisa saja sama dengan clock CPU.. ketika masuk L1,
data dipecah dua, berupa 'data' dan command / instruksi..
yang 'data' masuk register unit.. yang command, masuk ALU..
dst..
ini sebetulnya yang membedakan L1 dan L2.. data di L2 masih
raw.. sedangkan data di L1, tinggal di'caplok'.. makanya
didalam spec L2, masih ada istilah 'pembacaan spekulatif',
sedangkan di L1 udah nggak ada.. ;))
Balik ke soal cache level, sebetulnya manufakturer udah
mendesain sedemikian rupa besaran cache ini.. kalo yang
standar sih, efisiensi cache dihitung dari system pyramid..
contohnya system yang punya ipan :
troughput L1 cache is 8KB -- 184.2 MB/s 5.7
ns/byte (247%) (156%) 2.9 clks
troughput L2 cache is 512KB -- 137.9 MB/s 8.9 ns/byte
(158%) (100%) 4.5 clks
troughput Main memory speed -- 74.3 MB/s 14.1 ns/byte
(100%) [read] 7.2 clks
* diambil dari cachecheck v.4
** main memory 128MB FP 9 bits wide 60ns
Nah dari sini kan kelihatan.. kalo memory ipan tuh luambaaat
pisan.. biar lebih efisien harusnya ada satu layer cache
lagi.. yaitu L3 diantara L2 dan main memory.. jadi total
tabelnya harusnya kayak gini :
troughput L1 cache is 8KB -- 184.2 MB/s 5.7
ns/byte 2.9 clks
troughput L2 cache is 512KB -- 137.9 MB/s 8.9 ns/byte
4.5 clks
troughput L3 cache is 2048KB -- 100.0 MB/s 11.0 ns/byte
6.2 clks
troughput Main memory speed -- 74.3 MB/s 14.1 ns/byte
7.2 clks
cuman ya itu.. gimana caranya nambahin L3-nya?.. huehehe..
XP
>Tentunya lebih baik jika TIDAK ADA cache sama
>sekali (namun di-perlukan main memory yang
>mampu bekerja hingga sama dengan clock
>CPU).
::-----------------------------
Memory secepat processor?.. kenapa nggak?.. tapi yang jelas
solusi ini udah pasti kemahalan dan nggak efisien..
huehehe.. kenapa?.. sekarang ipan tanya, skema 'data flow'
dari processor ke media penyimpanan bagaimana sih?..
proc - L1 - L2 - memory controller - main memory - disk
cache - platter (skema pyramid)
kalo nggak ada cache, tapi main memory memproses secepat
CPU, berarti ada 'gap' besar sekali antara main memory
dengan platter (HDD scr fisik).. secara otomatis bisa
dikatakan bahwa processornya hanya akan bekerja maximum
secepat 2-3 kali kecepatan harddisknya.. kan lucu.. pernah
dengar ada processor 2 Tips (terra instruction / second)
tapi bekerja max hanya 80 Mips (million instruction per
second), hanya karena 'bottleneck' di storage-media ?.. ;))
Kalo mau komputer yang kecepatannya maximize itu, bukannya
hanya harus bikin main memory secepat processor.. tapi bikin
main memory sebanyak media penyimpanan dan juga secepat
processor.. jadi instruksi / command dan data semuanya
disimpan di memory statik (cth. 'kalo ada' PC400 FlashRAM)..
tapi harganya bo.. harga FlashRAM 2GB emangnya berapa yah
sekarang?.. huehehe.. yang PC400 lagi.. huehehe.. itu juga
kalo ada.. ;))..
>Kembali ke persoalan Celeron CPU, jika speed L2
>cache sama dengan L1 cache-nya, mengapa harus
>membuat dua level cache di CPU ini?
>Bukankah lebih baik jika L2 cache tersebut dibuat
>menjadi L1 cache?
>Sehingga waktu tundanya dapat berkurang?
::--------------------------
Susah membuat L1 onchip sebanyak L2.. wafer / dye-nya
bakalan besar sekali dan berarti biaya dan heatnya otomatis
bakalan mbengkak tanpa perbedaan performa yang berarti.. lag
ipula L1 dan L2 rada beda di skema pengambilan datanya kok..
soalnya di L2 antara command / instruksi dan data
dicampur.... ketika masuk ke L1, data dan instruksi
dipisah.. masing2 masuk jalur pipeline tersendiri dan dengan
tujuan akhir yang berbeda..
soal wait states, kalo dari cache, wait statesnya paling
hanya 2-6 WS.. sedangkan kalo nunggu data dari storage media
bisa kena >10 WS.. nah, delay karena WS di cache ini nggak
bakalan kerasa kok, dibandingin kalo L2 cache 'miss' dan
musti 'mancing' data dari storage media.. ;))
>Saya sudah menanyakan hal ini di forum newsgroup
>INTEL. Tapi sampai saat ini saya belum mendapatkan
>jawaban dari karyawan mereka.
::--------------------------
males nanggepinnya?.. huehehe.. karena jawabannya sebetulnya
bisa aja mbuat L2 jadi L1 cache.. dengan kata lain seperti
Celeron versi non cache.. why not?.. but what for?.. nggak
efisien dan bikin 'trouble' aja.. ;))
------------------------------------------------------
ipannatoly buandelikov buangetito
----------------------------------------------------------------
Compu-Mania MailingList is provided by PT Centrin Utama
Maintained by : [EMAIL PROTECTED]
To Post a msg : Send mail to [EMAIL PROTECTED]
To Unsubscribe : Mail to [EMAIL PROTECTED]
BODY : unsubscribe Compu-Mania
For more information, send mail to [EMAIL PROTECTED]
with "HELP" in the BODY of your mail (without quote).
----------------------------------------------------------------