Re: [Talk-de] Nominatim, Probleme und Merkwürdigkeiten
Am 19. November 2015 um 13:49 schrieb Sarah Hoffmann : > Das ist eine echte Falschzuordnung, die in etwa so geht: > Bekannte Abkürzungen werden auf die Anfrage angewendet, hier via -> v. > Ergibt sich somit "v gramsci, aquileia". Dann wird die List potentieller > Hausnummern abgesucht, und da steht 'v' drin. Hausnummern können aber in > der Anfrage wegfallen, bleibt "gramsci, aquileia" und das passt natürlich > auf die "Corso Antonio Gramsci, Aquileia". > Mir ist jetzt aufgefallen, dass es z.T. mehrere unterschiedliche Abkürzungen für dasselbe Wort gibt, z.B. quattro=4 quattro=IV es gibt übrigens auch den entgegengesetzten Fall, quarto=IV (d.h. gleiche Abkürzung mit unterschiedlicher Bedeutung) Gruß, Martin ___ Talk-de mailing list Talk-de@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-de
Re: [Talk-de] Nominatim, Probleme und Merkwürdigkeiten
On Thu, Nov 19, 2015 at 01:11:32PM +0100, Martin Koppenhoefer wrote: > Am 19. November 2015 um 12:22 schrieb Sarah Hoffmann : > > > > > Kurz gesagt, altbekanntes Problem. Wenn du etwas im Trac suchst, findest du > > reichlich Bugreports betreffst dem Problem mit dem Weglassen von Vornamen > > und > > Titeln in romanischen Sprachen in Nominatim. > > was ich vor allem komisch fand, dass "corso gramsci, aquileia" kein > Ergebnis brachte, "via gramsci, aquileia" aber schon (der richtige Name ist > aber Corso Antonio Gramsci), so eine Art Spezialbehandlung für Via scheint > es zu geben, die Corso bisher nicht berücksichtigt. Das ist eine echte Falschzuordnung, die in etwa so geht: Bekannte Abkürzungen werden auf die Anfrage angewendet, hier via -> v. Ergibt sich somit "v gramsci, aquileia". Dann wird die List potentieller Hausnummern abgesucht, und da steht 'v' drin. Hausnummern können aber in der Anfrage wegfallen, bleibt "gramsci, aquileia" und das passt natürlich auf die "Corso Antonio Gramsci, Aquileia". Die Lösung des Problems ist theoretisch einfach (merken, dass das v ein abgekürztes via ist), praktisch aber etwas trickreicher zu implementieren. > > Beste derzeitige Lösung ist die Angabe der üblichen Kurzform im short_name > > Tag. > > OK (das sind allerdings die meisten Straßen mit Namen, die dann diesen tag > bekommen), ähnlich machen wir das auch schon für Datumsangaben, wo sowohl > ausgeschrieben, arabische Ziffern und römische Zahlen vorkommen können > (z.B. "Via quattro Novembre", "Via 4 Novembre", "Via IV Novembre"). > Vielleicht könnten wir diese stattdessen auch in die Abkürzungstabelle als > Abkürzungen eintragen? (Es kommen nicht so viele Zahlen tatsächlich vor, > sind jeweils besondere Datumsangaben). Zahlen ist nochmal ein anderes Problem. Das ist noch viel relevanter für die Amerikaner mit den vielen durchnummerierten Sprachen. Trickreich wird es vor allem, weil Nominatim das natürlich in allen Sprachen können muss. > > Was ihr ausserdem als Community tun könnt, ist die Liste der üblichen > > Abkürzungen in > > http://wiki.openstreetmap.org/wiki/Name_finder:Abbreviations > > zu ergänzen. die italienische Sektion ist da gerade noch sehr knapp > > gehalten > > Werde ich auf jeden Fall ansprechen, sieht mir auf den ersten Blick schon > gar nicht schlecht aus, was wir da haben, gibt aber sicherlich noch mehr. Ich sehe, dass du schon einiges ergänzt hast. Wie gesagt, Zahlen ist noch ein anderes Problem. Aber was sich in der Liste noch gut macht, sind Titel (Capitano, Dottore etc.). Also eben das, was man üblicherweise an Abkürzungen in Strassennamen benutzt. > Wenn es nun mehrere Möglichkeiten gibt, tragen wir die dann einfach alle > untereinander ein, z.B. "S." kann sein: "San", "Sant'", "Santa"? Ja, bitte. Gruss Sarah ___ Talk-de mailing list Talk-de@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-de
Re: [Talk-de] Nominatim, Probleme und Merkwürdigkeiten
Vielen Dank für die Antwort! Am 19. November 2015 um 12:22 schrieb Sarah Hoffmann : > > Kurz gesagt, altbekanntes Problem. Wenn du etwas im Trac suchst, findest du > reichlich Bugreports betreffst dem Problem mit dem Weglassen von Vornamen > und > Titeln in romanischen Sprachen in Nominatim. > was ich vor allem komisch fand, dass "corso gramsci, aquileia" kein Ergebnis brachte, "via gramsci, aquileia" aber schon (der richtige Name ist aber Corso Antonio Gramsci), so eine Art Spezialbehandlung für Via scheint es zu geben, die Corso bisher nicht berücksichtigt. > Beste derzeitige Lösung ist die Angabe der üblichen Kurzform im short_name > Tag. OK (das sind allerdings die meisten Straßen mit Namen, die dann diesen tag bekommen), ähnlich machen wir das auch schon für Datumsangaben, wo sowohl ausgeschrieben, arabische Ziffern und römische Zahlen vorkommen können (z.B. "Via quattro Novembre", "Via 4 Novembre", "Via IV Novembre"). Vielleicht könnten wir diese stattdessen auch in die Abkürzungstabelle als Abkürzungen eintragen? (Es kommen nicht so viele Zahlen tatsächlich vor, sind jeweils besondere Datumsangaben). > Irgendwann wird Nomiantim (oder eine andere Suchmaschine) auch mal passende > Heuristiken zur Abkürzung lernen, aber das passiert nicht in naher Zukunft. > OK, wenn man das weiss ist man schon motivierter, die Sachen einzutragen > > Was ihr ausserdem als Community tun könnt, ist die Liste der üblichen > Abkürzungen in > http://wiki.openstreetmap.org/wiki/Name_finder:Abbreviations > zu ergänzen. die italienische Sektion ist da gerade noch sehr knapp > gehalten Werde ich auf jeden Fall ansprechen, sieht mir auf den ersten Blick schon gar nicht schlecht aus, was wir da haben, gibt aber sicherlich noch mehr. Wenn es nun mehrere Möglichkeiten gibt, tragen wir die dann einfach alle untereinander ein, z.B. "S." kann sein: "San", "Sant'", "Santa"? Gruß, Martin ___ Talk-de mailing list Talk-de@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-de
Re: [Talk-de] Nominatim, Probleme und Merkwürdigkeiten
Hi, On Thu, Nov 19, 2015 at 12:00:04PM +0100, Martin Koppenhoefer wrote: > niemand? Kurz gesagt, altbekanntes Problem. Wenn du etwas im Trac suchst, findest du reichlich Bugreports betreffst dem Problem mit dem Weglassen von Vornamen und Titeln in romanischen Sprachen in Nominatim. Beste derzeitige Lösung ist die Angabe der üblichen Kurzform im short_name Tag. Irgendwann wird Nomiantim (oder eine andere Suchmaschine) auch mal passende Heuristiken zur Abkürzung lernen, aber das passiert nicht in naher Zukunft. Was ihr ausserdem als Community tun könnt, ist die Liste der üblichen Abkürzungen in http://wiki.openstreetmap.org/wiki/Name_finder:Abbreviations zu ergänzen. die italienische Sektion ist da gerade noch sehr knapp gehalten. Auch die Integration dieser Liste wird noch eine Weile dauern, aber immerhin gibt es dafür bereits einen Plan. Gruss Sarah ___ Talk-de mailing list Talk-de@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-de
Re: [Talk-de] Nominatim, Probleme und Merkwürdigkeiten
niemand? Gruß, Martin ___ Talk-de mailing list Talk-de@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-de