Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-21 Diskussionsfäden Stephan Knauss
Markus writes: 

 Dem Renderer automatische Trankription/Transliteration beibringen zu 
 wollen halte ich in den nächsten Jahrzehnten für erfolglos.
warum? Ich rendere Thailand. Da hatte ich das über einen Zwischenschritt 
mal ausprobiert. Kein größeres Problem. Muss ja nicht live passieren.
Mir fehlt noch ein wenig das passende Tool, aber prinzipiell möglich. 

Stephan

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Markus
Hallo Martin,

 Wir brauchen ein Attribut für *Sprache* und eines für *Schrift*
 und zwar in den jeweiligen Kombinationen.

 soweit ich weiss, ist Schrift kein Problem, da wir utf codieren

_Schrift darstellen_
Schriften darstellen ist mit UTF-8 problemlos.

_Schrift übertragen_
Die Schwierigkeit ist, Namen die in einer fremden Schrift vorliegen,
in eine andere Schrift zu übertragen.

Denn dabei kann man nicht Buchstaben für Buchstaben übersetzen.
Bei einigen Schriften gibt es gar keine solchen Buchstaben.

Die Stichworte heissen:

Transkription (Aussprache-basiert)
http://de.wikipedia.org/wiki/Transkription_(Schreibung)

Transliteration (Schrift-basiert)
http://de.wikipedia.org/wiki/Transliteration

Das ist ein hochkomplexes Gebiet.
Ich verstehe davon nichts. Da müssen Fachleute ran.
Hier gibt es auch keine Möglichkeit, das zu erfassen was man sieht,
denn auf dem Orsschild sieht man immer nur die vor Ort gerade gültige 
Schrift. Ausnahme: Manche Kommunen verwenden auf einigen Ortsschildern 
zusätzlich zu ihrer lokalen Schrift eine lateinische Schrift (gesehen in 
China, Griechenland, Ägypten).

Gruss, Markus

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Gerrit
Am 18.05.2010 15:19, schrieb Markus:
 Hallo Martin,
 Das ist ein hochkomplexes Gebiet.
 Ich verstehe davon nichts. Da müssen Fachleute ran.
 Hier gibt es auch keine Möglichkeit, das zu erfassen was man sieht,
 denn auf dem Orsschild sieht man immer nur die vor Ort gerade gültige
 Schrift. Ausnahme: Manche Kommunen verwenden auf einigen Ortsschildern
 zusätzlich zu ihrer lokalen Schrift eine lateinische Schrift (gesehen in
 China, Griechenland, Ägypten).

 Gruss, Markus



Naja, das ist ja von Land zu Land unterschiedlich, anschließend auch 
noch von Sprache zu Sprache.

In China/Taiwan ist z.B. der Fall, dass es eine allgemeingültige 
Lateinumschrift gibt, die könnte dann auch direkt benutzt werden.

Beispiel:
chin: 國立台灣大學
chin. Umschrift: Guólì Táiwān Dàxué
engl.: National Taiwan University

ich sehe eigentlich kein Problem, das dort zu benutzen. Problematisch 
wird es nur eher bei Sprachen, die keine unabhängige Umschrift haben, 
d.h. wo die Umschrift immer an den umliegenden Text angepasst wird, z.B. 
Russisch.
Da müsste man die Umschrift dann eventuell immer passend in name:en bzw. 
name:de hinzufügen. Ansonsten könnte man eventuell schreiben: name:zh-Latn
so ist eigentlich auch die normale ISO-Richtlinie
Wenn man noch den Ort hinzufügen möchte, dann kann man das ja auch noch 
machen. z.B. heißt Bonn in China 波恩, in Taiwan aber 波昂. Das würde 
man dann entsprechend mit
name:zh-CN=波恩
name:zh-TW=波昂
kennzeichnen.
Ich sehe da eigentlich kein Problem drin. Die Regeln werden ja auch 
schon bei Wikipedia und allgemein im Internet angewandt.

Ich denke, die Sache hängt eigentlich nur vom Renderer ab.

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Markus
Hallo Gerrit,

danke für Deine Erläuterungen und Ergänzungen!

 von Land zu Land unterschiedlich, auch von Sprache zu Sprache.

Wir brauchen also (in vielen Fällen) einen Dreifachschlüssel:
Land, Sprache, Schrift.

Beispiel:
name:CH:de:latn=Biel
name:CH:fr:latn=Bienne

 In China/Taiwan gibt es eine allgemeingültige Lateinumschrift
 die könnte dann auch direkt benutzt werden.

+1

 Beispiel:
 chin: 國立台灣大學
 chin. Umschrift: Guólì Táiwān Dàxué
 engl.: National Taiwan University

Wie wäre dafür der Dreifachschlüssel zu bilden?

 Problematisch wird es bei Sprachen, die keine unabhängige Umschrift haben
 z.B. heißt Bonn in China 波恩, in Taiwan aber 波昂.
 Das würde man dann entsprechend mit:
 name:zh-CN=波恩
 name:zh-TW=波昂
 kennzeichnen.

Vielleicht reicht ja manchmal ein Zweifachschlüssel? (Sprache, Land)
Oder braucht man immer Dreifachschlüssel? (Sprache, Land, Schrift)

 Die Regeln werden auch bei Wikipedia und allgemein im Internet angewandt.

Kannst Du diese Regeln ins OSM-Wiki schreiben?
http://wiki.openstreetmap.org/wiki/DE:Key:name
http://wiki.openstreetmap.org/wiki/DE_talk:Key:name
Das würde beim Erfassen von Namen sehr helfen.

 Ich denke, die Sache hängt eigentlich nur vom Renderer ab.

Nein, der Renderer kann nur darstellen was die DB hergibt.
Wenn dort beispielsweise nicht kategorisiert historische Namen stehen 
würden,dann könnte der Renderer das nicht erkennen und würde sie als 
aktuelle Namen anzeigen. Und das könnte für OSM zu ernsthaften 
politischen Problemen führen.

Dem Renderer automatische Trankription/Transliteration beibringen zu 
wollen halte ich in den nächsten Jahrzehnten für erfolglos.

Gruss, Markus

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Gerrit
Am 18.05.2010 16:48, schrieb Markus:
 Hallo Gerrit,

 danke für Deine Erläuterungen und Ergänzungen!

 von Land zu Land unterschiedlich, auch von Sprache zu Sprache.

 Wir brauchen also (in vielen Fällen) einen Dreifachschlüssel:
 Land, Sprache, Schrift.

 Beispiel:
 name:CH:de:latn=Biel
 name:CH:fr:latn=Bienne

Du schreibst aber die Reihenfolge etwas falsch.
Erst kommt die Sprache (in Kleinbuchstaben), dann die Region (komplett 
in Großbuchstaben), dann möglicherweise noch die Schrift (vierstellig, 
erster Buchstabe groß).
Beispiel:
zh-TW-Latn
Das ganze halt auch im Normalfall per Bindestrich getrennt, nicht durch 
Doppelpunkt.

Dabei gilt aber das Prinzip: Das ganze soll so kurz wie möglich sein. 
Sprich: Auch wenn du Deutsch mit japanischen Schriftzeichen schreiben 
könntest, geht man im Normalfall davon aus, dass Deutsch mit mit dem 
lateinischen Alphabet geschrieben wird. Daher reicht name:de aus.
Wenn jetzt aber beispielsweise Österreich für Prag einen anderen Namen 
hätte, dann könntest du schreiben: name:de-AT=blabla

http://de.wikipedia.org/wiki/ISO_15924
Das hier wären die Schrifttags

 In China/Taiwan gibt es eine allgemeingültige Lateinumschrift
 die könnte dann auch direkt benutzt werden.

 +1

 Beispiel:
 chin: 國立台灣大學
 chin. Umschrift: Guólì Táiwān Dàxué
 engl.: National Taiwan University

 Wie wäre dafür der Dreifachschlüssel zu bilden?

name:zh=國立台灣大學
name:zh-Latn=Guólì Táiwān Dàxué
name:en=Guólì Táiwān Dàxué

Bei Chinesisch geht es aber noch komplizierter: Unterschiedliche 
Schreibweisen in China und in Taiwan:

name:zh-TW=國立台灣大學
name:zh-CN=国立台湾大学
name:zh-Latn=Guólì Táiwān Dàxué
name:en=Guólì Táiwān Dàxué


 Problematisch wird es bei Sprachen, die keine unabhängige Umschrift haben
 z.B. heißt Bonn in China 波恩, in Taiwan aber 波昂.
 Das würde man dann entsprechend mit:
 name:zh-CN=波恩
 name:zh-TW=波昂
 kennzeichnen.

 Vielleicht reicht ja manchmal ein Zweifachschlüssel? (Sprache, Land)
 Oder braucht man immer Dreifachschlüssel? (Sprache, Land, Schrift)

Im Allgemeinfall reicht auch ein Einfachschlüssel. Nur in ganz 
komplizierten Fällen könnte auch ein Dreifachschlüssel notwendig sein, 
beispielsweise für oben Bonn:

name:zh-CN=波恩
name:zh-CN-Latn=Bō’ēn
name:zh-TW=波昂
name:zh-TW-Latn=Bō’áng

(Dieser Fall ist im Grunde aber unsinnig, da Chinesen keine 
Lateinumschrift der Schrift brauchen. Die ist ja nur für Ausländer)

Wie gesagt: Es soll so kurz wie möglich sein.

 Die Regeln werden auch bei Wikipedia und allgemein im Internet angewandt.

 Kannst Du diese Regeln ins OSM-Wiki schreiben?
 http://wiki.openstreetmap.org/wiki/DE:Key:name
 http://wiki.openstreetmap.org/wiki/DE_talk:Key:name
 Das würde beim Erfassen von Namen sehr helfen.

Ich glaube, das wäre eher im internationalen Wiki besser aufgehoben. 
Meiner Meinung nach machen das ganze Länder (China, Japan, Korea, 
Taiwan; die restlichen Länder wahrscheinlich auch) komplett falsch. Da 
will ich mich jetzt aber nicht so aufspielen, dass meine Meinung die 
richtige ist. So sehe ich das ganze Problem nur.
Und wenn das nur ins Deutsche Wiki kommt, versteht es ja keiner.

 Ich denke, die Sache hängt eigentlich nur vom Renderer ab.

 Nein, der Renderer kann nur darstellen was die DB hergibt.
 Wenn dort beispielsweise nicht kategorisiert historische Namen stehen
 würden,dann könnte der Renderer das nicht erkennen und würde sie als
 aktuelle Namen anzeigen. Und das könnte für OSM zu ernsthaften
 politischen Problemen führen.

Ja, klar, aber wenn der Renderer nicht anzeigt, was die DB hergibt, ist 
das Interesse, die DB zu bereichen, doch ziemlich gering, oder nicht?

Aber ich sehe überhaupt gar keinen Sinn dadrin, dort historische Namen 
einzugeben. Ich dachte, Openstreetmap zeigt die aktuelle Lage an?
Wir nennen doch Istanbul auch nicht plötzlich Byzanz, oder doch?


 Dem Renderer automatische Trankription/Transliteration beibringen zu
 wollen halte ich in den nächsten Jahrzehnten für erfolglos.

Das ist auch etwas utopisch. Im Grunde sollte es kein Problem sein, bei 
der normalen Erfassung der Straßen direkt eine Transkription einzugeben 
(Wird ja aktuell so oder so schon oft gemacht - nur leider in dem 
falschen Feld).


  Grundsatz für die _Darstellung_:
 
  *internationale Karte*
  aktuelle amtliche Namen in amtlicher Schrift des angezeigten Ortes
  (so wie derzeit auf OSM.org)
 
  *Weltschrift-spezifische Karten*
  aktuelle amtliche Namen des angezeigten Ortes als Endonym, in der
  jeweiligen Weltschrift der Karte (also lateinische Schrift für Karten
  aus Europa, Amerika, etc, bzw. chinesische/russische/arabische Schrift
  in chinesischen/russischen/arabischen Karten).

Ich verstehe hier den Unterschied zwischen den beiden Karten nicht ganz. 
die internationale Karte würde doch das gleiche wie deine 
„Weltschrift-spezifische“ Karte sein, oder nicht?



  *Landesspezifische Karte*
  Aktuelle amtliche Namen des angezeigten Ortes als Endonym, in der
  jeweiligen Schrift des Herausgeberlandes. Exonyme nur wenn aktuell und
  amtlich. Beispiel für 

Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Raimond Spekking
Am 18.05.2010 10:48, schrieb Markus:
 Hallo Gerrit,
 
 danke für Deine Erläuterungen und Ergänzungen!
 
 von Land zu Land unterschiedlich, auch von Sprache zu Sprache.
 
 Wir brauchen also (in vielen Fällen) einen Dreifachschlüssel:
 Land, Sprache, Schrift.
 
 Beispiel:
 name:CH:de:latn=Biel
 name:CH:fr:latn=Bienne

Die Notwendigkeit länderspezifischer Schlüssel sehe ich nicht. Sprache +
evtl. Schrift sollte reichen. Letzteres auch nicht notwendingenweise als
Doppelschlüssel, sondern als Einfachschlüssel, genau so wie die Sprachen
in MediaWiki auch gehandhabt werden:

name:zh-hans = abc
name:zh-hant = def
name:zh-tw = ghj
usw.

Siehe hierzu die Liste der von MediaWiki unterstützten Sprachen:

http://svn.wikimedia.org/viewvc/mediawiki/trunk/phase3/languages/Names.php?view=markup


 Dem Renderer automatische Trankription/Transliteration beibringen zu 
 wollen halte ich in den nächsten Jahrzehnten für erfolglos.
 

Transliteration ist für manche Sprachen kein Zauberwerk und in MediaWiki
bereit implementiert, so dass ein Programmierer dort abgucken kann.

Am Beispiel des Artikels über Köln:
http://zh.wikipedia.org/zh-cn/科隆
http://zh.wikipedia.org/zh-hk/科隆
http://zh.wikipedia.org/zh-sg/科隆
http://zh.wikipedia.org/zh-tw/科隆

Das ist nur _ein_ Artikel, der unterschiedlich transliteriert wird.

Ähnlich im Kazachischen. Dort wird zwischen lateinisch, kyrillisch und
arabisch transliteriert:

http://kk.wikipedia.org/w/index.php?title=%D0%9A%D1%91%D0%BB%D1%8C%D0%BDvariant=kk-latn

http://kk.wikipedia.org/w/index.php?title=%D0%9A%D1%91%D0%BB%D1%8C%D0%BDvariant=kk-cyrl

http://kk.wikipedia.org/w/index.php?title=%D0%9A%D1%91%D0%BB%D1%8C%D0%BDvariant=kk-arab

Raymond.



signature.asc
Description: OpenPGP digital signature
___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Markus
Hallo Raimond, hallo Gerrit,

Danke für die vielen Informationen!
Ich bin gespannt, wie wir das alles zu einem verständlichen und 
nachvollziehbaren Schema zusammenbauen können.

Wir haben:
Schriftsystem: http://de.wikipedia.org/wiki/ISO_15924
Sprache: http://de.wikipedia.org/wiki/ISO_639
Land: http://de.wikipedia.org/wiki/ISO_3166-2
WP-Sprache: 
http://svn.wikimedia.org/viewvc/mediawiki/trunk/phase3/languages/Names.php?view=markup

Ziel dieses Threads ist:
- Beschreibung für sinnvolle Erfassung geografischer Namen
- sinnvolle Darstellung der Namen auf der Karte.

Wenn es das Ziel unserer freien Weltkarte ist, möglichst vielen Menschen 
eine Karte zur Verfügung zu stellen, dann ergeben sich m.E. folgende 
Prioritäten:

1. die Karte die wir jetzt haben mit regionaler Schrift
2. eine Karte in lateinischer Schrift
3. eine Karte in chinesischer Schrift
4. eine Karte in arabischer Schrift
5. eine Karte in kyrillischer Schrift
Immer jeweils mit Endonymen.

 Wir brauchen (in vielen Fällen) einen Dreifachschlüssel:
 Sprache, Land, Schrift.
 name:de:CH:Latn=Biel

 Die Notwendigkeit länderspezifischer Schlüssel sehe ich nicht. Sprache +
 evtl. Schrift sollte reichen. Letzteres auch nicht notwendingenweise als
 Doppelschlüssel, sondern als Einfachschlüssel, genau so wie die Sprachen
 in MediaWiki auch gehandhabt werden:

 name:zh-hans = abc
 name:zh-hant = def
 name:zh-tw = ghj
 usw.

 Siehe hierzu die Liste der von MediaWiki unterstützten Sprachen:

 http://svn.wikimedia.org/viewvc/mediawiki/trunk/phase3/languages/Names.php?view=markup

Und die Schrift ergibt sich immer eindeutig aus der Sprache?
Ja, das wäre dann viel einfacher.

Das würde für Biel bedeuten:
name=Biel/Bienne (da amtlicher Doppelname)
name:de=Biel
name:fr=Bienne

Gibt es keine Sprachen, die mehrere Schriftsysteme verwenden?
Oder Länder, die eine amtliche Regierungssprache, aber mehrere 
Landessprachen, oder gar mehrere Schriftsysteme haben?

Sonst brauchen wir eine Regel, wann/wofür/wie welche Kombination 
erforderlich ist. Und wenn es viele sind, dann wäre es vielleicht 
einfacher, immer die Dreifachkombination zu benutzen?

 Dem Renderer automatische Trankription/Transliteration beibringen

 Transliteration ist für manche Sprachen kein Zauberwerk und in MediaWiki
 bereit implementiert, so dass ein Programmierer dort abgucken kann.

Wow!
Was bedeutet das für unser Namens-Schema?
Arbeitet die Mapnik-Crew schon mit automatischer Transliteration?

Markus

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Frederik Ramm
Hallo,

Markus wrote:
 Danke für die vielen Informationen!
 Ich bin gespannt, wie wir das alles zu einem verständlichen und 
 nachvollziehbaren Schema zusammenbauen können.

Ich weise darauf hin, dass es durchaus auch denkbar waere, verschiedene 
Namen eines Objekts *nicht* in OSM selbst, sondern in einer getrennten 
Datenbank zu haben.

Schon heute scheinen Leute, die gezielt uebersetzen bzw. mehrsprachige 
Versionen pruefen wollen, nicht mit der Karte zu arbeiten, sondern sie 
machen sich lieber Auszuege z.B. von allen city-Nodes und gucken die an, 
sie arbeiten also mit Listen statt mit Geodaten. Wieso sollte das ein 
Renderer nicht genauso tun? Ich befuerchte, dass, wenn an dem Node 
London der chinesische oder arabische Name dranhaengt, dieser ziemlich 
leicht kaputt gehen kann (wenn jemand ohne entspr. Sprachkenntnisse den 
Node aendert und versehentlich auf die falsche Taste kommt...).

Bye
Frederik

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Raimond Spekking
Am 18.05.2010 14:01, schrieb Markus:
 
 Und die Schrift ergibt sich immer eindeutig aus der Sprache?

Nein, siehe den nächsten Abschnitt.

 Ja, das wäre dann viel einfacher.
 
 Das würde für Biel bedeuten:
 name=Biel/Bienne (da amtlicher Doppelname)
 name:de=Biel
 name:fr=Bienne
 
 Gibt es keine Sprachen, die mehrere Schriftsysteme verwenden?

Doch, neben Chinesisch z.B. Kasachich: Lateinisch, Kyrillisch und
Arabisch (was davon amtlich ist, ist eine andere Frage)

name=Köln
name:en=Cologne
name:kk-cyrl=Кёльн
name:kk-latn=Kyolʹn
name:kk-arab=كيولن


 Oder Länder, die eine amtliche Regierungssprache, aber mehrere 
 Landessprachen, oder gar mehrere Schriftsysteme haben?

Mein Ansatz ist sprachenbasiert, wie in der Wikipedia, nicht länderbasiert.
In xx.wikipedia.org steht das xx immer für eine Sprache, nie für ein Land.
Deswegen zeigt ch.wikipedia.org auch auf die Wikipedia in der Sprache
Chamorro, und nicht auf eine (nicht vorhandene) Schweizer Wikipedia.

Welche Kombinationen aus (Minderheiten)Sprachen und Länder es gibt,
interessiert mich in diesem Zusammenhang nicht.

Optimalerweise wollen wir Karten in jeder Sprache und jedem ihrer
Schriftsysteme erstellen, völlig unabhängig davon, in welchem Land die
Sprache gesprochen wird bzw. in welchem Land der Betrachter sitzt.

 Sonst brauchen wir eine Regel, wann/wofür/wie welche Kombination 
 erforderlich ist. Und wenn es viele sind, dann wäre es vielleicht 
 einfacher, immer die Dreifachkombination zu benutzen?

Nach meiner vorhergehenden Argumentation brauchen wir genau das dann
nämlich nicht.

 
 Dem Renderer automatische Trankription/Transliteration beibringen

 Transliteration ist für manche Sprachen kein Zauberwerk und in MediaWiki
 bereit implementiert, so dass ein Programmierer dort abgucken kann.
 
 Wow!
 Was bedeutet das für unser Namens-Schema?
 Arbeitet die Mapnik-Crew schon mit automatischer Transliteration?
 

Würde mich auch interessieren.

Raymond.



signature.asc
Description: OpenPGP digital signature
___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Claudius
Mal etwas Input aus einem Land, dass das Problem praktisch betrifft:
In Iran taggen wir in name in weiten Teilen Persisch in Persischer 
Schrift. Im Westen auch Kurdisch in Lateinischer Schrift, aber das ist 
politisch grenzwertig, da Landessprache dort auch on the ground 
Persisch ist.

Und jetzt kommt's: In name:en wird meist die Transliteration gepackt, 
sofern es keinen echten englischen Namen gibt. Theoretisch müsste das 
wohl name:fa-Latn sein, aber hier wird name:en als 
Internationalisierung und damit quasi als Ersatz für das unsägliche 
int_name verwendet (Unsäglich deshalb, weil keine Aussage darüber 
getroffen wird, was diese Internationale Sprache ist, in der es 
erfasst ist.)

Am 18.05.2010 14:31, Raimond Spekking:
 Am 18.05.2010 14:01, schrieb Markus:
 Oder Länder, die eine amtliche Regierungssprache, aber mehrere
 Landessprachen, oder gar mehrere Schriftsysteme haben?

 Mein Ansatz ist sprachenbasiert, wie in der Wikipedia, nicht länderbasiert.
 In xx.wikipedia.org steht das xx immer für eine Sprache, nie für ein Land.

+1

 Dem Renderer automatische Trankription/Transliteration beibringen

 Transliteration ist für manche Sprachen kein Zauberwerk und in MediaWiki
 bereit implementiert, so dass ein Programmierer dort abgucken kann.

 Wow!
 Was bedeutet das für unser Namens-Schema?
 Arbeitet die Mapnik-Crew schon mit automatischer Transliteration?


 Würde mich auch interessieren.

Mapnik verwendet keine automatische Transliteration. MkgMap hat 
basierend auf einem Perl-Modul Ansätze davon (Etwa automatisiert aus dem 
Arabischen/Persischen ins Lateinische).

Claudius


___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden M∡rtin Koppenhoefer
Am 18. Mai 2010 14:23 schrieb Frederik Ramm frede...@remote.org:
 Ich weise darauf hin, dass es durchaus auch denkbar waere, verschiedene
 Namen eines Objekts *nicht* in OSM selbst, sondern in einer getrennten
 Datenbank zu haben.


das führt auch zu Problemen. Es wird es für den Mapper komplizierter.
Wenn ich dann einen Namen korrigieren oder hinzufügen will, muss ich
mich zusätzlich um einen externen Eintrag kümmern. Wenn wir dann noch
verschiedene solcher Listen bekommen, wird es vollends schwierig, da
die Fehler zu finden bzw. diese Listen zu synchronisieren.

 Schon heute scheinen Leute, die gezielt uebersetzen bzw. mehrsprachige
 Versionen pruefen wollen, nicht mit der Karte zu arbeiten, sondern sie
 machen sich lieber Auszuege z.B. von allen city-Nodes und gucken die an,
 sie arbeiten also mit Listen statt mit Geodaten.


Man kann auch sagen: heute noch. Ich würde es begrüßen, wenn OSM
(nebenher) mal zu einer Weltdatenbank der Namen in verschiedenen
Sprachen und Schriften wird.


 Wieso sollte das ein
 Renderer nicht genauso tun? Ich befuerchte, dass, wenn an dem Node
 London der chinesische oder arabische Name dranhaengt, dieser ziemlich
 leicht kaputt gehen kann (wenn jemand ohne entspr. Sprachkenntnisse den
 Node aendert und versehentlich auf die falsche Taste kommt...).


strg+z und versehentliche Tastendrücke sind schnell rückgängig zu
machen. Ausserdem steht der alte Eintrag ja in der History.

Gruß Martin

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Sven Geggus
Raimond Spekking raimond.spekk...@gmail.com wrote:

 Wow!
 Was bedeutet das für unser Namens-Schema?
 Arbeitet die Mapnik-Crew schon mit automatischer Transliteration?
 
 
 Würde mich auch interessieren.

Sowas sollte man definitiv nicht in einen Renderer einbauen. Ich könnte mir
das eher als Funktion im Postgres vorstellen. Unser Vorteil ist hier ja dass
wir keine eindeutige bidirektionale Transkription brauchen. oneway richtung
Latei reicht uns ja. Thai wäre so ein Beispiel wo es diese Eindeutigkeit
wohl eher nicht gibt.

Wenn zum Beispiel ein Select aus der Datenbank เชียงใหม่ als Ortsnamen
liefert könnte zum Beispiel eine transliterate Funktion daraus dann
automatisch Chiang Mai machen. Dass es sich um Thai handelt und man
deshalb keine chinesische Transliterateation verwenden sollte kann man
generell anhand des verwendeten UTF-8 Bereiches sogar automatisch erkennen.

Eine generische Karte mit lateinischer Schrift halte ich für zunehmend
wichtiger. Es gibt nämlich bereits jetzt guterfasste Länder wo mir die Karte
trotzdem überhaupt nix hilft.

Gruss

Sven

-- 
If we want hardware to work to its full potential, we need to claim to
be a recent version of Windows. (Matthew Garrett)

/me is gig...@ircnet, http://sven.gegg.us/ on the Web

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Markus
Hallo Frederik,

 Namen eines Objekts in einer getrennten Datenbank

Wenn das für den Renderer-Workflow möglich ist, scheint mir das ideal.
OSM baut eine eigene weltweite multilinguale *OSM-Geo-Namen-DB*.
Aus der sich die Renderer, Router und anderen Anwendungen bedienen.

Exemplarisch beginnen könnte man mit den Ländern und Hauptstädten.
Und dann alle grossen und kleineren Orte.
Neben den Daten aus OSM könnte man auch die Daten aus WP und die von 
LOCODE füttern.

Laienhaft stelle ich mir vor, dass man die Geodaten-DB um ein paar 
hundert Ortsnamen-Tabellen erweitert (für jede Sprache eine)?
Oder wären das zwei Datenbanken?

Wie wäre dann der Workflow zwischen
- OSM-Geoddaten-DB, OSM-Namen-DB und editierendem Benutzer?
- OSM-Geoddaten-DB, OSM-Namen-DB und Anwendungen?

 Ich befuerchte, dass, wenn an dem Node
 London der chinesische oder arabische Name dranhaengt, dieser ziemlich
 leicht kaputt gehen kann (wenn jemand ohne entspr. Sprachkenntnisse den
 Node aendert und versehentlich auf die falsche Taste kommt...).

Sehe ich auch so.

Gruss, Markus

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Frederik Ramm
Hallo,

Markus wrote:
 Wenn das für den Renderer-Workflow möglich ist, scheint mir das ideal.
 OSM baut eine eigene weltweite multilinguale *OSM-Geo-Namen-DB*.
 Aus der sich die Renderer, Router und anderen Anwendungen bedienen.

Wo ein Wille ist, ist auch ein Weg. Man kann ja im Mapnik-Style 
beliebige selects angeben, also auch einen, bei dem ich z.B. einen 
OSM-Namen mit einer Fremdtabelle joine, um ggf. dort den passenden 
Namen fuer die Karte auszulesen.

 Laienhaft stelle ich mir vor, dass man die Geodaten-DB um ein paar 
 hundert Ortsnamen-Tabellen erweitert (für jede Sprache eine)?
 Oder wären das zwei Datenbanken?

Das ist dann ein Implementierungsdetail. Ich denke, beim Rendern sollte 
man eine zusaetzliche Tabelle haben, in der man den in OSM gefundenen 
Namen nachschlaegt, und die Tabelle hat dann fuer jede 
Sprache/Schrift/whatever eine Spalte.

Die Sprachtabelle muesste im Renderer vorgehalten werden und koennte 
unabhaengig von OSM-Daten aktualisiert werden. Wie die Sprachtabelle 
editiert und verbreitet wird, darueber habe ich mir keine Gedanken 
gemacht. OSM waere dafuer nicht das richtige Medium. Vielleicht eine 
Wikiseite, oder Google Docs ;-)

Bye
Frederik

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Markus
Hallo Sven,

 automatischer Transliteration

 sollte man definitiv nicht in einen Renderer einbauen.
 Ich könnte mir das eher als Funktion im Postgres vorstellen.

Und damit die neue OSM-Namens-DB füttern...
Ist vermutlich effizienter, mit der Funktion einmal eine Tabelle zu 
füttern, und daraus dann die Daten zu holen?

 Unser Vorteil ist hier ja dass
 wir keine eindeutige bidirektionale Transkription brauchen.
 oneway richtung Latein reicht uns ja.

Und die anderen Schriftsysteme brauchen zusätzlich noch oneway von 
Latein zu ihrem Schriftsystem.

 Eine generische Karte mit lateinischer Schrift halte ich für zunehmend
 wichtiger. Es gibt nämlich bereits jetzt guterfasste Länder wo mir die Karte
 trotzdem überhaupt nix hilft.

Eine *Karte in lateinischer Schrift* halte ich für eines der wichtigsten 
Ziele zur Verbreitung der Karte.
Eine Namens-DB könne ein guter Weg sein.
Dann wären auch weitere Schriftsysteme machbar,
und der Benutzer könnte bald frei wählen.

Gruss, Markus

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden M∡rtin Koppenhoefer
Am 18. Mai 2010 15:41 schrieb Frederik Ramm frede...@remote.org:
 Wie die Sprachtabelle
 editiert und verbreitet wird, darueber habe ich mir keine Gedanken
 gemacht. ... Vielleicht eine Wikiseite, oder Google Docs ;-)


Das ist wohl beides nicht Dein Ernst, oder? Eine Wikiseite würde das
Wiki doch extrem aufblasen, oder Google Docs, wo man auf das Gutdünken
von Google angewiesen ist, dass das ganze nicht mal ein
kostenpflichtiger Service wird?

Gruß Martin

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Rendering vom Ausland - Schrift

2010-05-18 Diskussionsfäden Frederik Ramm
M?rtin Koppenhoefer wrote:
 Wie die Sprachtabelle
 editiert und verbreitet wird, darueber habe ich mir keine Gedanken
 gemacht. ... Vielleicht eine Wikiseite, oder Google Docs ;-)
 
 Das ist wohl beides nicht Dein Ernst, oder? Eine Wikiseite würde das
 Wiki doch extrem aufblasen, oder Google Docs, wo man auf das Gutdünken
 von Google angewiesen ist, dass das ganze nicht mal ein
 kostenpflichtiger Service wird?

Von Google Docs halte ich selber wenig, aber ich wuerde das denen 
ueberlassen, die die Uebersetzungen pflegen moechten. Und das mit der 
Wikiseite meine ich so halb-ernst, schliesslich wurde hier schon davon 
gesprochen, man koennte die Interwiki-Links aus Wikipedia automatisch 
abgreifen. Hieraus eine Tabelle fuer Mapnik zu machen, waere trivial; 
wenn jemand dann eine zusaetzliche Uebersetzung wuenscht, muesste er nur 
in der Wikipedia einen Interwiki-Link erstellen.

Das setzt natuerlich voraus, dass dieser ganze Mechanismus nur fuer Orte 
zur Anwendung kommt, die fuer die Wikipedia relevant genug sind.

Eventuell waere es auch eine Moeglichkeit, diese Namensliste in der 
OpenGeoDB zu pflegen, vielleicht haben die ja ein einfaches Interface 
fuer sowas. Was wir bei OSM an Editoren haben, ist dafuer ja eher nix.

Bye
Frederik


___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de