On Sat 2012-03-10 (00:20), Michael Bemmerl wrote: > Mitja Kleider schrieb: > > On 03/09/2012 07:28 PM, Steffen Grunewald wrote: > >> (wenn encode("utf-8") einen Fehler > >> produziert, dann schlimmstenfalls den "near XYZ"-Teil ganz weglassen, > >> hier in der Gegend produziert geonames teilweise ziemlich haarsträubende > >> Sachen). > > > > Stimmt, der Ortsname ist nicht besonders präzise, sollte man mal durch > > einen OSM Geocoder ersetzen ;) > > > > Ich habe "near XYZ" auf dem Server rausgenommen, damit der Feed wieder > > funktioniert. Vielleicht hast du ja Lust, [1] weiter voranzutreiben. > > Ich hab' das mal auf meinem lokalen Rechner ausprobiert, und konnte den > Fehler bei mir lösen, indem ich den MySQL-Client auf UTF-8 konfiguriert > habe. Bei mir ist (auch?) noch die Standard-Zeichenkodierung von Mysql > auf latin1 eingestellt. Auch das encode("utf-8") brauchte es nicht mehr. > > Ich hab' die Änderung mal in meinen Fork eingecheckt [1].
Hmm, ich habe jetzt erst einmal in den Sourcecode geguckt, Python ist nicht meine Baustelle - und irgendwie vermute ich ja, daß die Daten in der DB auch noch ein Mix aus ISO8819-irgendwas und UTF-8 sein werden - in dem Fall hülfe gar nix außer ausgiebiger Fehlerbehandlung. Gut, man könnte wahrscheinlich gucken, ob >=0x80 ohne UTF-konforme "Fortsetzung" auftauchen und dann mit Latin-xy weiterzumachen versuchen... (was bei "äß" vermutlich spektakulär in die Hose geht). Ich würde jedenfalls erst einmal die Geocoder-DB ansehen, welche Überraschungen dort noch warten. Anstelle des "near $name" könnte ich mir (etwa auf volle Bogenminuten gerundete) Positionen vorstellen, ich sehe zwar die Koordinaten im Link, aber nur in Dezimalgrad... S _______________________________________________ Talk-de mailing list Talk-de@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-de