Jörg Tewes <[EMAIL PROTECTED]> wrote on 27.11.05:

> Samstag, 26.11.05 Michael Heydekamp schrub...
>> Jörg Tewes <[EMAIL PROTECTED]> wrote on 25.11.05:

>>> Mir war es bisher nur nicht richtig bewußt das, das Zeichen nicht
>>> nur nicht/falsch dargestellt wird, sondern das es komplett
>>> vernichtet wird.

>> Dann ist in den letzten Jahren aber einiges an Dir vorbeigegangen.

> Das mag durchaus sein. Wenn alles "funktioniert" und keiner was sagt
> denkt man alles ist in Ordnung.

Transliteration ist ja auch "in Ordnung".  Mir ging's mehr um die
zwingende Logik, daß im Zielzeichensatz nicht existierende Zeichen bei
einer Konvertierung immer "vernichtet" werden *müssen*.

Siehst Du ja auch bei Gruppen, für die Du ASCII als Zeichensatz
eingestellt hast:  Da ist ein in ein "ae" konvertiertes "ä" im Grunde
auch für immer "vernichtet", weil die pauschale Rückwandlung von "ae" in
"ä" mitunter einfach falsch wäre.

Und genauso wenig, wie man erkennen kann, welche "ae" in ein "ä"
rückzuwandeln wären, kann man erkennen, welche "t" oder "p" ursprünglich
mal ein Thorn waren.  Außer man benutzt lexikalische Routinen (weiß
nicht, ob es diesen Begriff gibt, ich nenn's einfach mal so).

>>> Bisher dachte ich immer es würde nur nicht korrekt dargestellt
>>> beim versenden aber wieder richtig versendet werden.

>> Wie sollte das gehen?

> Gute Frage. Hab ich aber keine Antwort drauf. Ich habe mich mit der
> Funktionsweise des UUZ [...] nicht beschäftigt.

Vergiß mal den UUZ und denk nur an die dahinterstehende Logik.  Wenn es
eine gäbe, würd ich sie ihm dann schon beibringen...

Das Problem hat BTW nicht nur XP, sondern ganz viele Konsolenreader, die
mit einem definierten Zeichensatz arbeiten.  Mit dem Unterschied, daß
die meist auf *IX-Systemen laufen und der hierzulande von Hause aus
meist ISO-8859-1 ist.  Die haben dann natürlich keine Probleme mit dem
Thorn (dafür aber eben mit anderen Zeichen).

Daher auch die diversen "?", die man häufig in Betreffs und im Text
sieht (wobei ein anderer Grund für die "?" auch eine fehlende bzw.
fehlerhafte Zeichensatzdeklaration sein kann).

>> Was war denn jetzt mit der Smilie-Recherche?  Hattest Du jetzt
>> "geschickt" ausgeblendet.. ;-)

> Ich hatte schon mal recherchiert, aber bei Google dermaßen viele
> Ergebnisse erhalten das ich erstmal keine Antwort gegeben habe.
> Einfach bei Google alle Smilies rauszufinden und in eine Datei zu
> schreiben kann doch nicht alles sein oder?

Genau. :)

> Ich meine das ist doch hauptsächlich C&P oder seh ich das falsch. Es
> gibt ja haufenweise Seiten im Netz die diverse Smilies in ihrer
> Bedeutung erklären. HAb ich was übersehen?

Vielleicht die Analyse der gefundenen Daten und die Entwicklung einer
Logik...? ;-)  Etwa so:

"Wenn Du unmittelbar vor einem Thorn die Zeichen "-", ":", ";", "B" oder
"8" findest und sich unmittelbar hinter dem Thorn ein Leerzeichen, "."
oder nichts mehr befindet, ist es in 99% aller Fälle ein Smilie und
daher wäre der Thorn in diesen Fällen in ein 'p' oder 'P' zu
konvertieren statt in ein 't'."

Also: Passende Logik her, dann seh ich mir das an (bei UTF-7/8 könnte es
allerdings aufwendig werden). :)

BTW: Wenn man in Google nach "-[Thorn]" sucht (also mit <Alt-0254> das
Zeichen wirklich eingibt), bekommt man 156.000.000 Treffer.  Erst hatte
ich mich gewundert, daß es im Netz soviele Smilies mit Thorn geben soll,
bis ich feststellte, daß Google auch alle Treffer anzeigt, in denen ein
"th" vorkommt.

Auch da findet also eine Transliteration statt.


        Michael
------------------------------------------------------------------------
FreeXP Entwickler-Mailingliste
Dev-List@freexp.de
http://www.freexp.de/cgi-bin/mailman/listinfo/dev-list

Reply via email to