Re: [PUG] UBUNTU Server

Klaus Klein Tue, 02 Jan 2007 14:00:26 -0800

Max Trense wrote:

So einfach ist es eben nicht unbedingt. Striping bedeutet, dassaufeinanderfolgende Blöcke (auf den Arbeitsspeicher übertragen sind das dannwohl am ehesten Pages) auf unterschiedlichen physikalischen Medien befinden.Der entscheidende Vorteil dieser Technik kommt zum Tragen, wenn eine Dateisequentiell in den Arbeitsspeicher gelesen wird. Bei diesem Vorgang wirdjeder einzelne Block gelesen und an eine bestimmte Stelle in denArbeitsspeicher geschrieben. Da aber die meisten Komponenten eines ComputersDaten viel schneller übertragen können, als selbst die schnellstenFestplatten, warten logischerweise während der Übertragung alle dieseKomponenten auf die Daten von der Festplatte. Legt man jetzt aber dieeinzelnen Blöcke auf unterschiedliche Medien und ist dieRead-Ahead-Funktionalität richtig konfiguriert, kann man eben mehrere Blöckegleichzeitig laden. Selbst mit vielen Festplatten erreicht man so kaum dieGeschwindigkeit des Arbeitsspeichers, kann jedoch bei einer genügenden Anzahlvon Festplatten die Durchsatzrate erheblich steigern. Diese Steigerung liegtim Regelfall bei nahezu 100%, was das Striping gerade für große Dateien rechtinteressant macht.

Um das kurz auf den Punkt zu Bringen: Bei grossen Dateien, welchesequenziell gelesen werden, wird das optimum da liegen wo der Read-Aheadein ganzzahliges mehrfaches der Groesse eines Stripes entspricht.

Ein Problem ist aber auch hier der Overhead. Der fällt imVergleich zur Performancesteigerung zwar recht gering aus, aber es gibt ebenauch Fälle, in denen es nicht möglich ist, mehrere Blöcke parallel zu lesen.Eben dieser Fall ist bei Swap gegeben: Arbeitsspeicher wird in der Regelnicht in zusammenhängenden Clustern benötigt, sondern meistens nur einzelnePages. Und das entspricht dem Laden eines einzelnen Blocks von derFestplatte.

Kurze Frage: Warum müssen Pages, gerade bei multithreaded Anwendungenoder MultiKern/Prozessoren, immer 'sequenziell' geswapped (Autsch, ganzübles Neudeutsch) werden? Ich denke schon das hier mächtig'parallelisiert' werden kann. Zudem ist die Wahrscheinlichkeit, das dieBlöcke welche gelesen oder geschrieben werden müssen aufunterschiedlichen Platten liegen, beim Stripping (über zwei oder mehrerePlatten) nun mal nahe 50:50 (bei zwei) oder grösser (bei mehrerenPlatten). Somit sollte eigentlich genau hier das Thema mit derVerteilung des Overheads (Kopfbewegung) greifen.

Da dieser Vorgang nicht parallelisierbar ist, gibt es natürlichauch keine Performance-Steigerung.


Nochmal. Warum nicht?

BTW. die Grösse einer Page ist nicht zufällig ein Vielfaches von 512Byte und somit ein ideales Vielfaches der Blockgrösse, was dann wiederideal zum Read-Ahead passt?

Einen ähnlichen Fall gibt es bei sehrkleinen Dateien. Natürlich könnte man nun die Blockgröße des Dateisystems aufeinen kleineren Wert konfigurieren. Das bringt allerdings wegen der Seektimeder Festplatte nicht besonders viel.

Bei der Änderung der Blockgrösse wird man bei einer nicht fragmentiertenDatei wohl keinen Unterschied messen, zumindest nicht wenn die Dateinicht über die Zylindergrenze der Platte hinausreicht und somit ohneKopfbewegung gelesen wird. (und so ein Zylinder ist schon mächtig gross.;-) )

Die Abwägung zwischen Striping oder nicht ist also wirklich nicht ganz trivialund definitiv nicht allgemein entscheidbar ;-)


Genau dies kann ich aber aus Deinen Ausführungen eben nicht entnehmen. :-(

Wo ist da eigentlich der Unterschied zwischen zusammenhängendem Speicher
und Dateien?


Hauptsächlich in der Blockgröße und der Zugriffsmethode.


Hmm, versteh ich nicht. ;-)

Die Blockgrösse auf der Platte ist für beide gleich und bei 'nerDatenbank gibt es bestimmt genauso viel 'Random-Access' wie beim Swappen.

Und eine Swap-Partition ist unter Unix sowieso wie alles eine Datei.(*duckundweg*)


Gruß,
Klaus
--
----------------------------------------------------------------------------
PUG - Penguin User Group Wiesbaden - http://www.pug.org

Re: [PUG] UBUNTU Server

Antwort per Email an