Re: [Neo] Unicode: preferred character (was: Re: Griechisch schreiben mit Neo)
Am Sonntag, 14. Februar 2010 22:04:17 schrieb Carsten Ace Dahlmann: > Bei den Majuskeln werden übrigens auch bei den Buchstaben, die unseren > gleich sind, die griechischen erzeugt: GREEK CAPITAL LETTER ALPHA usw. Richtig – und das ist auch gut so. Wie du bereits angemerkt hast, würde eine Suche sonst nicht zwingend funktionieren, obwohl viele Suchprogramme häufig nach mehreren Codes eines optisch gleichen Zeichen suchen. Was also bei Buchstaben sinnvoll ist, ist für mich bei geometrischen Zeichen schlicht unverständlich, ruft es doch genau die Fragen hervor, die wir uns gerade stellen. Aber ändern können wir es nicht – heißt: letztlich ist es egal, welches Zeichen verwendet wird. Gruß, Pascal signature.asc Description: This is a digitally signed message part.
Re: [Neo] Unicode: preferred character (was: Re: Griechisch schreiben mit Neo)
Hi! Am Sun, 14 Feb 2010 18:51:01 +0100 schrieb Pascal Hauck: > Auch bei den Punkten hat Unicode leider nicht subsummiert, sondern > seperate Codes vergeben. Wenn die Mehrheit der Benutzer jedoch den > mid dot · anstatt eines anderen Codepunktes, wo sich ein identisches > Zeichen findet, verwendet, so erwähnt Unicode dies zumindest. Hmm. Also prinzipiell ist es meines Erachtens ja nicht verkehrt, dass es verschiedene Unicode-Zeichen gibt für Zeichen, die zwar gleich aussehen, aber in einen anderen Zusammenhang gehören. Inwiefern das z.B. beim m sinnvoll ist, da lässt sich sicher drüber streiten. Aber z.B. bei den griechischen Majuskeln oder dem Fragezeichen – oder um ein nicht-griechisches Beispiel zu nehmen Δ, Laplace‑Operator ∆ und Dreieck △ (Letzteres sieht bei mir übrigens etwas anders aus) – halte ich es insofern für sinnvoll, als im Zweifelsfall besser danach gesucht werden kann. Allein schon, wenn man nach „E“ und nach „Ε“ googlet: Letzteres ist ein Epsilon, das Erste ein E. Bei den griechischen Majuskeln kommt natürlich noch hinzu, dass man anscheinend nur diese und nicht unsere Lateinischen mit den Spiritus verbinden kann. Aber das Entscheidende ist, finde ich, dass man gemischte Datensätze erzeugt mit den „falschen“ Zeichen, die aber ähnlich aussehen. Daher ist die Frage: Inwiefern tritt diese Empfehlung letztlich in Erscheinung? Ich habe jetzt einfach mal nachgeschaut, was die Standard-Tastatur für die Griechen so erzeugt. Sie erzeugt die empfohlenen Zeichen U+00B7 und U+003B für Fragezeichen und Middledot. Wobei der Grund dafür aber wohl der sein muss, dass das noch von der Codepage ISO-8859-7 (Greek) herrührt. Aber egal: Solange die Griechen diese beiden grundlegenden Zeichen auch so erzeugen, sollte Neo nicht plötzlich die anderen nehmen. Bei den Majuskeln werden übrigens auch bei den Buchstaben, die unseren gleich sind, die griechischen erzeugt: GREEK CAPITAL LETTER ALPHA usw. LG, Ace -- () ascii ribbon campaign - against html e-mail /\ www.asciiribbon.org - against proprietary attachments http://www.dahlmann.net/?Informatives/Gekonntes_E-Mailen signature.asc Description: PGP signature
Re: [Neo] Unicode: preferred character (was: Re: Griechisch schreiben mit Neo)
Am Sonntag, 14. Februar 2010 18:19:49 schrieb Carsten Ace Dahlmann: > Was bedeutet es im Unicode-Zusammenhang, wenn ein > Zeichen offiziell bevorzugt wird? Wieso wird das gemacht? Kennt sich da > jemand aus? Ich kann zumindest eine Vermutung anstellen. Der Unicode versucht, für alle relevanten Zeichen, einen Codepunkt anzubieten. Nun gibt es aber Zeichen, die mehrfach verwendet werden, z.B. wird das »m« als Buchstabe, aber auch als Einheitensymbol (Meter) und als SI‑Vorsilbe (milli) verwendet. Und an der Stelle wird Unicode inkonsequent. Während alle Bedeutungen sinnvollerweise unter einem Codepunkt subsummiert werden, wird neben dem Buchstaben Ω ein Einheitensymbol Ω und neben dem Buchstaben μ eine SI‑Vorsilbe µ mit je eigenem Codepunkt. Besonders schlimm ist es bei einfachen geometrischen Formen: Warum der Buchstabe Δ, der Laplace‑Operator ∆ und das Dreieck △ von Unicode unterschieden werden, erschließt sich überhaupt nicht. Will man etwas bestimmtes auszudrücken (z.B. die symmetrische Differenz), muss man sich entscheiden. Auch bei den Punkten hat Unicode leider nicht subsummiert, sondern seperate Codes vergeben. Wenn die Mehrheit der Benutzer jedoch den mid dot · anstatt eines anderen Codepunktes, wo sich ein identisches Zeichen findet, verwendet, so erwähnt Unicode dies zumindest. Ich habe anfangs versucht, den Unterschied zwischen mid dot · und Malzeichen ⋅ zu betonen – inzwischen bin ich davon aber ganz abgekommen und halte es für eine Designschwäche des Unicode, die Neo nicht mitmachen muss. In Neo2 gibt es zwar beide, was jemand verwendet, soll mir aber egal sein – und für Neo3 hoffe ich, dass wir uns auf eines dieser beiden Zeichen einigen können. Gruß, Pascal signature.asc Description: This is a digitally signed message part.
[Neo] Unicode: preferred character (was: Re: Griechisch schreiben mit Neo)
Hi! Am Sun, 14 Feb 2010 17:28:59 +0100 schrieb Carsten Ace Dahlmann : > wobei es dafür > übrigens auch ein eigenes Zeichen gibt. Ist da vielleicht auch besser, > um am gleichen Unicode-Block zu bleiben. > > U+037E (894) ; GREEK QUESTION MARK > > Dasselbe finde ich, inzwischen, beim Middledot. Auch hier vielleicht > lieber das dafür vorgesehene Zeichen. Vielleicht muss ich diese Überlegung nochmal zurückziehen. Die Gnome-Zeichentabelle sagt jeweils: U+0387 GREEK ANO TELEIA • functions in Greek like a semicolon • U+00B7 MIDDLE DOT is the preferred character U+037E GREEK QUESTION MARK • sentence-final punctuation • U+003B SEMICOLON is the preferred character Nun frage ich mich: Was bedeutet es im Unicode-Zusammenhang, wenn ein Zeichen offiziell bevorzugt wird? Wieso wird das gemacht? Kennt sich da jemand aus? LG, Ace -- () ascii ribbon campaign - against html e-mail /\ www.asciiribbon.org - against proprietary attachments http://www.dahlmann.net/?Informatives/Gekonntes_E-Mailen signature.asc Description: PGP signature