Bodo,

On 08.06.2011 22:47, Bodo Meissner wrote:

Das erschwert das Zusammensetzen etwas, weil man einmal ein Leerzeichen 
einfügen muß und einmal nicht. Vermutlich lassen sich (sprachabhängig) Regeln 
definieren, bei welchen Zeichen das Leerzeichen entfällt.

Ich will übrigens gar nichts aufbrechen :) Im Gegenteil, ich bin mit "name=Limburg 
an der Lahn" vollkommen zufrieden.

Die Software-Entwickler wahrscheinlich nicht.
Die Trennung wäre nicht nur für den Renderer nützlich, sondern auch für einen 
Suchalgorithmus. So könnte der Anwender wählen, ob er das Suchmuster nur im 
"Kern" oder auch im Präfix oder Suffix suchen möchte.

vielleicht habe ich mich etwas missverständlich ausgedrückt, sorry. Du hast vollkommen recht, sowohl das Zusammensetzen als auch das Trennen ist schwierig bis nahezu unmöglich (im Fall der Übersetzung - maschinelle Übersetzung hat selbst für normalen Fließtext nur eher bescheidene Ergebnisse und wir reden hier von Eigennamen, die grundsätzlich aus einem Wörterbuch kommen).

Mein Vorschlag ist, das Zusammensetzen und das Trennen durch Software vollständig zu eliminieren, indem man immer in jedem einzelnen Tag einen vollständigen zusammenhängenden Namen einträgt.

Also zum Beispiel (gerade bei alt_name kann man wieder drüber streiten, allerdings käme das gerade einem Suchalgorithmus zu gute):

name=Frankfurt am Main
short_name=Frankfurt
official_name=Frankfurt am Main, Stadt # Kommt aus dem Gemeindeverzeichnis
alt_name=Frankfurt (Main);Frankfurt/Main;Frankfurt/M.
name:ru=Франкфурт-на-Майне
short_name:ru=Франкфурт

name=Hamburg
alt_name=Hansestadt Hamburg
official_name=Freie und Hansestadt Hamburg

Das hat für I18N den Vorteil, dass immer vollständige Namen übersetzt werden. Der Renderer kann sich dann den kürzesten Aussuchen, wenn er keinen Platz hat. Und ein Suchalgorithmus kannst du auch darüber laufen lassen, ohne irgendwie Preprocessing mit Präfixen und Suffixen zu betreiben.

Das ist alles doch schon in Key:name im Wiki erklärt und geregelt. name:prefix und name:suffix übrigens auch [1], ist eigentlich ganz überraschend, wofür das eigentlich mal gedacht war.

Da du auch "die Softwareentwickler" angesprochen hast: Ich bin auch einer ;) Also, hier die ungefilterte Entwicklersicht:

Als Entwickler will ich letzten Endes die Daten mindestens der ersten Normalform. Und wir diskutieren hier nichts anderes als was die korrekte erste Normalform für Ortsnamen ist (eigentlich für administrative Einheiten, aber sei's drum). Die einen sagen: wir normalisieren in drei Teile, Präfix, Kern, Suffix für irgendeine vage Definition von Kern, Präfix und Suffix. Ich sage: der Name ist schon eine Einheit in sich und braucht nicht weiter zerteilt zu werden. Wenn es mehrere Namen gibt, ist doch schön, sollen sie als mehrere Namen entsprechend ihrer Bedeutung bitte auch eingetragen werden. Aber ein Name ist zusammenhängend, in sich abgeschlossen und sollte im Idealfall von keiner Software irgendwie weiter transformiert werden, weil das spätestens bei mehreren Sprachen nicht mehr entscheidbar ist. Manchmal braucht man andere Trennzeichen. Manchmal ändert sich auch die Reihenfolge der Wörter bei der Übersetzung. Manchmal gibt es einen gänzlich anderen Namen. Manchmal gibt es zusätzlichen Präpositionen. Manchmal wird ein Teil des Namens dekliniert.

Mein Problem mit der Präfix-Kern-Suffix-Aufteilung ist auch, dass sie mehr oder weniger willkürlich und präsentationsorientiert ist. Alle Tags in Key:name haben auch eine eigene in der echten Welt relevante Bedeutung. Deswegen präferiere ich diese Variante.

Ich gehe davon aus, daß Du das in den meisten Fällen nach Gefühl richtig 
eintragen kannst und nur in Ausnahmefällen die Regeln lesen müßtest.
Danke für das Vertrauen :) Aber zwischen nur selten und gar nicht liegt auch ein Unterschied.

Bisher stelle ich mir die Entscheidung recht einfach vor: Welche Bezeichnung 
würde ich auf einer Karte erwarten, wenn der Platz knapp ist? Das wäre der 
Name. Alles davor ist Präfix, alles danach Suffix. Oder hast Du ein Beispiel 
für einen schwierigen Fall?
Martin Strutmann hat in seinen Beiträgen in diesem Thread dankenswerterweise eine ganze Reihe von Beispielen gebracht. Die Wakendorf-Serie ist zum Beispiel sehr interessant.

Außerdem ist der von dir geschilderte Gedankengang Renderer-orientiert. Kann man machen, aber das vernachlässigt wieder alle anderen Anwendungen. Außerdem: Print oder Web? Welcher Stil? Welcher Kartenzweck?

Mein Gedankengang ist: "Frankfurt am Main" ist ein zusammenhängender vollständiger Name, der kommt in einen Tag rein, Ende. "Frankfurt" ist eine gebräuchliche alternative Verkürzung, also kommt es in "alt_name" oder "short_name", Ende. Viel einfacher, als über Renderer, Stile und überhaupt Anwendungen nachzudenken.

Wohlgemerkt: ich habe nichts gegen alternative vollständige Namen (alt_name, 
old_name, name:alternative, name:official, name:$YOUR_QUALIFIER, ...), nur 
Bedenken gegen das Zerstückeln.

Einmal vollständig und einmal nur der Hauptteil wäre auch möglich, ist aber 
etwas redundant und hat IMHO mehr Fehlermöglichkeiten.
Genau das schlage ich vor. Das bisschen Redundanz erspart uns aber einen Haufen von irgendwelchen Trennungs- und Zusammensetzungsalgorithmen, die jetzt nicht gerade ein Beispiel für Robustheit sein werden - natürlich auch IMHO.

Viele Grüße
Igor

[1] http://wiki.openstreetmap.org/wiki/Key:name:prefix

_______________________________________________
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de

Antwort per Email an