Hallo allerseits,
Matthias Wächter schrieb am 01.04.2009 04:29 Uhr:
On 3/31/2009 9:54 PM, Dennis Heidsiek wrote:
@Mœsi: Hat der NeoVars vielleicht ein Problem mit Unicode-Codepoints außerhalb der Basic Multilingual Plane?
Natürlich hat es ein Problem damit, es ist (derzeit) schlicht nur für die BMP
geeignet.
Vielen Dank für die Aufklärung, ich war mir nur gerade nicht so ganz sicher.
Für den ganzen Unicode-Raum braucht man Surrogate-Unterstützung, soweit ich auf
die Schnelle herauszufinden im Stande war.
Ach ja, kaum dass man Unicode in die Welt gesetzt hatte, merkte man dass
man doch nicht mit 2^16 Zeichen auskommen würde, und schon waren die
Surrogates geboren¹ …
Mal schauen, ab wann es mir in den Fingern juckt, den Code hier anzupassen. :-)
Ich muss jedenfalls den ganzen Code einer gründlichen Review unterziehen – es
ist nicht nur die Umprogrammierung von SendUnicodeChar, sondern sehr viel
Hartgekotetes
… hartge/code/tes, manchmal sind Anglizismen doch sinnvovoll – es sei
denn, das war ein bewußtes Wortspiel ;-).
4-Hexzeichen-Getue, das nun auf 6 Zeichen erweitert werden muss, vielleicht
auch den kürzeren Formen gegenüber tolerant.
Das hört sich nach viel Arbeit an :-(.
Und so dringend ist es ja nun auch wieder nicht, da außerhalb der BMP
bisher nur diverse asiatische Zeichen (und anscheinend auch ein paar
seltenere Mathematik-Zeichen) liegen. Aber schöner wär’s natürlich …
Viele Grüße,
Dennis-ſ
¹ http://de.wikipedia.org/wiki/UTF-16