Re: [Neo] Unicode: preferred character (was: Re: Griechisch schreiben mit Neo)

2010-02-15 Diskussionsfäden Pascal Hauck
Am Sonntag, 14. Februar 2010 22:04:17 schrieb Carsten Ace Dahlmann:
> Bei den Majuskeln werden übrigens auch bei den Buchstaben, die unseren
> gleich sind, die griechischen erzeugt: GREEK CAPITAL LETTER ALPHA usw.

Richtig – und das ist auch gut so. Wie du bereits angemerkt hast, würde eine 
Suche sonst nicht zwingend funktionieren, obwohl viele Suchprogramme häufig 
nach mehreren Codes eines optisch gleichen Zeichen suchen.

Was also bei Buchstaben sinnvoll ist, ist für mich bei geometrischen Zeichen 
schlicht unverständlich, ruft es doch genau die Fragen hervor, die wir uns 
gerade stellen.

Aber ändern können wir es nicht – heißt: letztlich ist es egal, welches 
Zeichen verwendet wird.


Gruß,
Pascal


signature.asc
Description: This is a digitally signed message part.


Re: [Neo] Unicode: preferred character (was: Re: Griechisch schreiben mit Neo)

2010-02-14 Diskussionsfäden Carsten Ace Dahlmann
Hi!

Am Sun, 14 Feb 2010 18:51:01 +0100
schrieb Pascal Hauck:

> Auch bei den Punkten hat Unicode leider nicht subsummiert, sondern
> seperate Codes vergeben. Wenn die Mehrheit der Benutzer jedoch den
> mid dot · anstatt eines anderen Codepunktes, wo sich ein identisches
> Zeichen findet, verwendet, so erwähnt Unicode dies zumindest.

Hmm. Also prinzipiell ist es meines Erachtens ja nicht verkehrt, dass
es verschiedene Unicode-Zeichen gibt für Zeichen, die zwar gleich
aussehen, aber in einen anderen Zusammenhang gehören. Inwiefern das
z.B. beim m sinnvoll ist, da lässt sich sicher drüber streiten. Aber
z.B. bei den griechischen Majuskeln oder dem Fragezeichen – oder um ein
nicht-griechisches Beispiel zu nehmen Δ, Laplace‑Operator ∆ und Dreieck
△ (Letzteres sieht bei mir übrigens etwas anders aus) – halte ich es
insofern für sinnvoll, als im Zweifelsfall besser danach gesucht werden
kann. Allein schon, wenn man nach „E“ und nach „Ε“ googlet: Letzteres
ist ein Epsilon, das Erste ein E. Bei den griechischen Majuskeln kommt
natürlich noch hinzu, dass man anscheinend nur diese und nicht unsere
Lateinischen mit den Spiritus verbinden kann. Aber das Entscheidende
ist, finde ich, dass man gemischte Datensätze erzeugt mit den
„falschen“ Zeichen, die aber ähnlich aussehen.

Daher ist die Frage: Inwiefern tritt diese Empfehlung letztlich in
Erscheinung? 

Ich habe jetzt einfach mal nachgeschaut, was die Standard-Tastatur für
die Griechen so erzeugt. Sie erzeugt die empfohlenen Zeichen U+00B7 und
U+003B für Fragezeichen und Middledot.

Wobei der Grund dafür aber wohl der sein muss, dass das noch von der
Codepage ISO-8859-7 (Greek) herrührt.

Aber egal: Solange die Griechen diese beiden grundlegenden Zeichen auch
so erzeugen, sollte Neo nicht plötzlich die anderen nehmen.

Bei den Majuskeln werden übrigens auch bei den Buchstaben, die unseren
gleich sind, die griechischen erzeugt: GREEK CAPITAL LETTER ALPHA usw.

LG,
Ace
-- 
()  ascii ribbon campaign - against html e-mail 
/\  www.asciiribbon.org   - against proprietary attachments

http://www.dahlmann.net/?Informatives/Gekonntes_E-Mailen


signature.asc
Description: PGP signature


Re: [Neo] Unicode: preferred character (was: Re: Griechisch schreiben mit Neo)

2010-02-14 Diskussionsfäden Pascal Hauck
Am Sonntag, 14. Februar 2010 18:19:49 schrieb Carsten Ace Dahlmann:
> Was bedeutet es im Unicode-Zusammenhang, wenn ein
> Zeichen offiziell bevorzugt wird? Wieso wird das gemacht? Kennt sich da
> jemand aus?

Ich kann zumindest eine Vermutung anstellen. Der Unicode versucht, für alle 
relevanten Zeichen, einen Codepunkt anzubieten.
Nun gibt es aber Zeichen, die mehrfach verwendet werden, z.B. wird das »m« als 
Buchstabe, aber auch als Einheitensymbol (Meter) und als SI‑Vorsilbe (milli) 
verwendet. Und an der Stelle wird Unicode inkonsequent. Während alle 
Bedeutungen sinnvollerweise unter einem Codepunkt subsummiert werden, wird 
neben dem Buchstaben Ω ein Einheitensymbol Ω und neben dem Buchstaben μ eine 
SI‑Vorsilbe µ mit je eigenem Codepunkt.

Besonders schlimm ist es bei einfachen geometrischen Formen: Warum der 
Buchstabe Δ, der Laplace‑Operator ∆ und das Dreieck △ von Unicode 
unterschieden werden, erschließt sich überhaupt nicht. Will man etwas 
bestimmtes auszudrücken (z.B. die symmetrische Differenz), muss man sich 
entscheiden.

Auch bei den Punkten hat Unicode leider nicht subsummiert, sondern seperate 
Codes vergeben. Wenn die Mehrheit der Benutzer jedoch den mid dot · anstatt 
eines anderen Codepunktes, wo sich ein identisches Zeichen findet, verwendet, 
so erwähnt Unicode dies zumindest.
Ich habe anfangs versucht, den Unterschied zwischen mid dot · und Malzeichen ⋅ 
zu betonen – inzwischen bin ich davon aber ganz abgekommen und halte es für 
eine Designschwäche des Unicode, die Neo nicht mitmachen muss. In Neo2 gibt es 
zwar beide, was jemand verwendet, soll mir aber egal sein – und für Neo3 hoffe 
ich, dass wir uns auf eines dieser beiden Zeichen einigen können.


Gruß,
Pascal


signature.asc
Description: This is a digitally signed message part.


[Neo] Unicode: preferred character (was: Re: Griechisch schreiben mit Neo)

2010-02-14 Diskussionsfäden Carsten Ace Dahlmann
Hi!

Am Sun, 14 Feb 2010 17:28:59 +0100
schrieb Carsten Ace Dahlmann :

> wobei es dafür
> übrigens auch ein eigenes Zeichen gibt. Ist da vielleicht auch besser,
> um am gleichen Unicode-Block zu bleiben.
> 
> U+037E (894)   ;  GREEK QUESTION MARK
> 
> Dasselbe finde ich, inzwischen, beim Middledot. Auch hier vielleicht
> lieber das dafür vorgesehene Zeichen.


Vielleicht muss ich diese Überlegung nochmal zurückziehen. Die
Gnome-Zeichentabelle sagt jeweils:

U+0387 GREEK ANO TELEIA
 • functions in Greek like a semicolon
 • U+00B7 MIDDLE DOT is the preferred character

U+037E GREEK QUESTION MARK
 • sentence-final punctuation
 • U+003B SEMICOLON is the preferred character


Nun frage ich mich: Was bedeutet es im Unicode-Zusammenhang, wenn ein
Zeichen offiziell bevorzugt wird? Wieso wird das gemacht? Kennt sich da
jemand aus?

LG,
Ace
-- 
()  ascii ribbon campaign - against html e-mail 
/\  www.asciiribbon.org   - against proprietary attachments

http://www.dahlmann.net/?Informatives/Gekonntes_E-Mailen


signature.asc
Description: PGP signature