Hallo Dennis!

On 4/15/2009 3:47 PM, Dennis Heidsiek wrote:
> leider ist auch der 3.0-Beta2-Thunderbird noch nicht
> Surrogate-kompatibel, aber das wird sicherlich irgendwann kommen.
> Allerdings ist das Programm da wahrlich nicht alleine … aber das kommt
> schon noch :-).

Von Notepad++ bin ich auch schwer enttäuscht. Ich dachte, die hätten
sich mit UTF-16 tatsächlich beschäftigt. Aber gut – sie nennen es
auch (richtiger Weise) nur UCS-2. Andererseits ist auf die Art der
UTF-8-Support auch eher suboptimal. Sie unterstützen SMP weder in
Dateien, noch als Eingabe.

> Ich habe sowieso nie verstanden, warum sich die meisten Betriebsſysteme
> für UTF-16 mit Surrogates statt für UTF-32 entschieden haben.

Was sind für dich „die meisten“? Linux zeigt doch mit dem
vernünftigen Default UTF-8 doch, wie man’s richtig macht (wenn man
denn schon variable-length-Encoding nehmen muss). ;-)

> Schließlich sind heutzutage doch die allermeisten Prozessorregister
> entweder 32 oder 64 Bit groß.

Trotzdem wollen Daten geschaufelt werden, und UTF-32 erzeugt nun mal
den 4-fachen Traffic von UTF-8 (mit ASCII-Inhalt), das wirkt sich
auf I/O-Performance doch deutlich aus.

Wenn man überlegt, wie lange es gedauert hat, bis ein vernünftiger
BMP-Support in den Programmen vorhanden war – jetzt muss man den
Code halt noch einmal in die Hand nehmen und für UTF-16 fit(t)
machen. All jene, die geglaubt haben, dass UCS-2 der Weisheit
letzter schluss sei und sie um besagtes Variable-length-Encoding
herum kommen, wurden jetzt eines Besseren belehrt.

Vergessen wir nicht, dass es die Firma Microsoft war, die schon früh
in Win32-Programmen auf UCS-2 gesetzt hat – zur damaligen Zeit
deutlich revolutionärer als der Einsatz von UTF-32 heute. Jetzt
bekommen sie die Rechnung dafür präsentiert, dass sie einfach nur zu
früh dran waren.

Warten wir’s ab – vielleicht wird Unicode ja in garnicht so ferner
Zukunft von etwas Anderem¹ abgelöst… bis dahin warte ich, dass man
unter Windows die Codepage 65001 aktivieren kann² ;-)

– Mœsi

1: http://de.wikipedia.org/wiki/GB_18030
2: … und das dann auch tatsächlich wie erwartet funktioniert.

Attachment: signature.asc
Description: OpenPGP digital signature

Antwort per Email an