Bodo,
On 08.06.2011 22:47, Bodo Meissner wrote:
Das erschwert das Zusammensetzen etwas, weil man einmal ein Leerzeichen
einfügen muß und einmal nicht. Vermutlich lassen sich (sprachabhängig) Regeln
definieren, bei welchen Zeichen das Leerzeichen entfällt.
Ich will übrigens gar nichts aufbrechen :) Im Gegenteil, ich bin mit "name=Limburg
an der Lahn" vollkommen zufrieden.
Die Software-Entwickler wahrscheinlich nicht.
Die Trennung wäre nicht nur für den Renderer nützlich, sondern auch für einen
Suchalgorithmus. So könnte der Anwender wählen, ob er das Suchmuster nur im
"Kern" oder auch im Präfix oder Suffix suchen möchte.
vielleicht habe ich mich etwas missverständlich ausgedrückt, sorry. Du
hast vollkommen recht, sowohl das Zusammensetzen als auch das Trennen
ist schwierig bis nahezu unmöglich (im Fall der Übersetzung -
maschinelle Übersetzung hat selbst für normalen Fließtext nur eher
bescheidene Ergebnisse und wir reden hier von Eigennamen, die
grundsätzlich aus einem Wörterbuch kommen).
Mein Vorschlag ist, das Zusammensetzen und das Trennen durch Software
vollständig zu eliminieren, indem man immer in jedem einzelnen Tag einen
vollständigen zusammenhängenden Namen einträgt.
Also zum Beispiel (gerade bei alt_name kann man wieder drüber streiten,
allerdings käme das gerade einem Suchalgorithmus zu gute):
name=Frankfurt am Main
short_name=Frankfurt
official_name=Frankfurt am Main, Stadt # Kommt aus dem Gemeindeverzeichnis
alt_name=Frankfurt (Main);Frankfurt/Main;Frankfurt/M.
name:ru=Франкфурт-на-Майне
short_name:ru=Франкфурт
name=Hamburg
alt_name=Hansestadt Hamburg
official_name=Freie und Hansestadt Hamburg
Das hat für I18N den Vorteil, dass immer vollständige Namen übersetzt
werden. Der Renderer kann sich dann den kürzesten Aussuchen, wenn er
keinen Platz hat. Und ein Suchalgorithmus kannst du auch darüber laufen
lassen, ohne irgendwie Preprocessing mit Präfixen und Suffixen zu betreiben.
Das ist alles doch schon in Key:name im Wiki erklärt und geregelt.
name:prefix und name:suffix übrigens auch [1], ist eigentlich ganz
überraschend, wofür das eigentlich mal gedacht war.
Da du auch "die Softwareentwickler" angesprochen hast: Ich bin auch
einer ;) Also, hier die ungefilterte Entwicklersicht:
Als Entwickler will ich letzten Endes die Daten mindestens der ersten
Normalform. Und wir diskutieren hier nichts anderes als was die korrekte
erste Normalform für Ortsnamen ist (eigentlich für administrative
Einheiten, aber sei's drum). Die einen sagen: wir normalisieren in drei
Teile, Präfix, Kern, Suffix für irgendeine vage Definition von Kern,
Präfix und Suffix. Ich sage: der Name ist schon eine Einheit in sich und
braucht nicht weiter zerteilt zu werden. Wenn es mehrere Namen gibt, ist
doch schön, sollen sie als mehrere Namen entsprechend ihrer Bedeutung
bitte auch eingetragen werden. Aber ein Name ist zusammenhängend, in
sich abgeschlossen und sollte im Idealfall von keiner Software irgendwie
weiter transformiert werden, weil das spätestens bei mehreren Sprachen
nicht mehr entscheidbar ist. Manchmal braucht man andere Trennzeichen.
Manchmal ändert sich auch die Reihenfolge der Wörter bei der
Übersetzung. Manchmal gibt es einen gänzlich anderen Namen. Manchmal
gibt es zusätzlichen Präpositionen. Manchmal wird ein Teil des Namens
dekliniert.
Mein Problem mit der Präfix-Kern-Suffix-Aufteilung ist auch, dass sie
mehr oder weniger willkürlich und präsentationsorientiert ist. Alle Tags
in Key:name haben auch eine eigene in der echten Welt relevante
Bedeutung. Deswegen präferiere ich diese Variante.
Ich gehe davon aus, daß Du das in den meisten Fällen nach Gefühl richtig
eintragen kannst und nur in Ausnahmefällen die Regeln lesen müßtest.
Danke für das Vertrauen :) Aber zwischen nur selten und gar nicht liegt
auch ein Unterschied.
Bisher stelle ich mir die Entscheidung recht einfach vor: Welche Bezeichnung
würde ich auf einer Karte erwarten, wenn der Platz knapp ist? Das wäre der
Name. Alles davor ist Präfix, alles danach Suffix. Oder hast Du ein Beispiel
für einen schwierigen Fall?
Martin Strutmann hat in seinen Beiträgen in diesem Thread
dankenswerterweise eine ganze Reihe von Beispielen gebracht. Die
Wakendorf-Serie ist zum Beispiel sehr interessant.
Außerdem ist der von dir geschilderte Gedankengang Renderer-orientiert.
Kann man machen, aber das vernachlässigt wieder alle anderen
Anwendungen. Außerdem: Print oder Web? Welcher Stil? Welcher Kartenzweck?
Mein Gedankengang ist: "Frankfurt am Main" ist ein zusammenhängender
vollständiger Name, der kommt in einen Tag rein, Ende. "Frankfurt" ist
eine gebräuchliche alternative Verkürzung, also kommt es in "alt_name"
oder "short_name", Ende. Viel einfacher, als über Renderer, Stile und
überhaupt Anwendungen nachzudenken.
Wohlgemerkt: ich habe nichts gegen alternative vollständige Namen (alt_name,
old_name, name:alternative, name:official, name:$YOUR_QUALIFIER, ...), nur
Bedenken gegen das Zerstückeln.
Einmal vollständig und einmal nur der Hauptteil wäre auch möglich, ist aber
etwas redundant und hat IMHO mehr Fehlermöglichkeiten.
Genau das schlage ich vor. Das bisschen Redundanz erspart uns aber einen
Haufen von irgendwelchen Trennungs- und Zusammensetzungsalgorithmen, die
jetzt nicht gerade ein Beispiel für Robustheit sein werden - natürlich
auch IMHO.
Viele Grüße
Igor
[1] http://wiki.openstreetmap.org/wiki/Key:name:prefix
_______________________________________________
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de