Re: [Talk-de] Nominatim, Probleme und Merkwürdigkeiten

2015-11-19 Diskussionsfäden Sarah Hoffmann
Hi,

On Thu, Nov 19, 2015 at 12:00:04PM +0100, Martin Koppenhoefer wrote:
> niemand?

Kurz gesagt, altbekanntes Problem. Wenn du etwas im Trac suchst, findest du
reichlich Bugreports betreffst dem Problem mit dem Weglassen von Vornamen und
Titeln in romanischen Sprachen in Nominatim.

Beste derzeitige Lösung ist die Angabe der üblichen Kurzform im short_name
Tag. Irgendwann wird Nomiantim (oder eine andere Suchmaschine) auch mal passende
Heuristiken zur Abkürzung lernen, aber das passiert nicht in naher Zukunft.

Was ihr ausserdem als Community tun könnt, ist die Liste der üblichen
Abkürzungen in http://wiki.openstreetmap.org/wiki/Name_finder:Abbreviations
zu ergänzen. die italienische Sektion ist da gerade noch sehr knapp
gehalten. Auch die Integration dieser Liste wird noch eine Weile dauern,
aber immerhin gibt es dafür bereits einen Plan.

Gruss

Sarah

___
Talk-de mailing list
Talk-de@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Nominatim, Probleme und Merkwürdigkeiten

2015-11-19 Diskussionsfäden Martin Koppenhoefer
niemand?

Gruß,
Martin
___
Talk-de mailing list
Talk-de@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Nominatim, Probleme und Merkwürdigkeiten

2015-11-19 Diskussionsfäden Martin Koppenhoefer
Vielen Dank für die Antwort!


Am 19. November 2015 um 12:22 schrieb Sarah Hoffmann :

>
> Kurz gesagt, altbekanntes Problem. Wenn du etwas im Trac suchst, findest du
> reichlich Bugreports betreffst dem Problem mit dem Weglassen von Vornamen
> und
> Titeln in romanischen Sprachen in Nominatim.
>



was ich vor allem komisch fand, dass "corso gramsci, aquileia" kein
Ergebnis brachte, "via gramsci, aquileia" aber schon (der richtige Name ist
aber Corso Antonio Gramsci), so eine Art Spezialbehandlung für Via scheint
es zu geben, die Corso bisher nicht berücksichtigt.



> Beste derzeitige Lösung ist die Angabe der üblichen Kurzform im short_name
> Tag.



OK (das sind allerdings die meisten Straßen mit Namen, die dann diesen tag
bekommen), ähnlich machen wir das auch schon für Datumsangaben, wo sowohl
ausgeschrieben, arabische Ziffern und römische Zahlen vorkommen können
(z.B. "Via quattro Novembre", "Via 4 Novembre", "Via IV Novembre").
Vielleicht könnten wir diese stattdessen auch in die Abkürzungstabelle als
Abkürzungen eintragen? (Es kommen nicht so viele Zahlen tatsächlich vor,
sind jeweils besondere Datumsangaben).



> Irgendwann wird Nomiantim (oder eine andere Suchmaschine) auch mal passende
> Heuristiken zur Abkürzung lernen, aber das passiert nicht in naher Zukunft.
>


OK, wenn man das weiss ist man schon motivierter, die Sachen einzutragen



>
> Was ihr ausserdem als Community tun könnt, ist die Liste der üblichen
> Abkürzungen in
> http://wiki.openstreetmap.org/wiki/Name_finder:Abbreviations
> zu ergänzen. die italienische Sektion ist da gerade noch sehr knapp
> gehalten



Werde ich auf jeden Fall ansprechen, sieht mir auf den ersten Blick schon
gar nicht schlecht aus, was wir da haben, gibt aber sicherlich noch mehr.
Wenn es nun mehrere Möglichkeiten gibt, tragen wir die dann einfach alle
untereinander ein, z.B. "S." kann sein: "San", "Sant'", "Santa"?


Gruß,
Martin
___
Talk-de mailing list
Talk-de@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Nominatim, Probleme und Merkwürdigkeiten

2015-11-19 Diskussionsfäden Sarah Hoffmann
On Thu, Nov 19, 2015 at 01:11:32PM +0100, Martin Koppenhoefer wrote:
> Am 19. November 2015 um 12:22 schrieb Sarah Hoffmann :
> 
> >
> > Kurz gesagt, altbekanntes Problem. Wenn du etwas im Trac suchst, findest du
> > reichlich Bugreports betreffst dem Problem mit dem Weglassen von Vornamen
> > und
> > Titeln in romanischen Sprachen in Nominatim.
> 
> was ich vor allem komisch fand, dass "corso gramsci, aquileia" kein
> Ergebnis brachte, "via gramsci, aquileia" aber schon (der richtige Name ist
> aber Corso Antonio Gramsci), so eine Art Spezialbehandlung für Via scheint
> es zu geben, die Corso bisher nicht berücksichtigt.

Das ist eine echte Falschzuordnung, die in etwa so geht:
Bekannte Abkürzungen werden auf die Anfrage angewendet, hier via -> v.
Ergibt sich somit "v gramsci, aquileia". Dann wird die List potentieller
Hausnummern abgesucht, und da steht 'v' drin. Hausnummern können aber in
der Anfrage wegfallen, bleibt "gramsci, aquileia" und das passt natürlich
auf die "Corso Antonio Gramsci, Aquileia".

Die Lösung des Problems ist theoretisch einfach (merken, dass das v ein
abgekürztes via ist), praktisch aber etwas trickreicher zu implementieren.

> > Beste derzeitige Lösung ist die Angabe der üblichen Kurzform im short_name
> > Tag.
> 
> OK (das sind allerdings die meisten Straßen mit Namen, die dann diesen tag
> bekommen), ähnlich machen wir das auch schon für Datumsangaben, wo sowohl
> ausgeschrieben, arabische Ziffern und römische Zahlen vorkommen können
> (z.B. "Via quattro Novembre", "Via 4 Novembre", "Via IV Novembre").
> Vielleicht könnten wir diese stattdessen auch in die Abkürzungstabelle als
> Abkürzungen eintragen? (Es kommen nicht so viele Zahlen tatsächlich vor,
> sind jeweils besondere Datumsangaben).

Zahlen ist nochmal ein anderes Problem. Das ist noch viel relevanter für
die Amerikaner mit den vielen durchnummerierten Sprachen. Trickreich wird
es vor allem, weil Nominatim das natürlich in allen Sprachen können muss.

> > Was ihr ausserdem als Community tun könnt, ist die Liste der üblichen
> > Abkürzungen in
> > http://wiki.openstreetmap.org/wiki/Name_finder:Abbreviations
> > zu ergänzen. die italienische Sektion ist da gerade noch sehr knapp
> > gehalten
> 
> Werde ich auf jeden Fall ansprechen, sieht mir auf den ersten Blick schon
> gar nicht schlecht aus, was wir da haben, gibt aber sicherlich noch mehr.

Ich sehe, dass du schon einiges ergänzt hast.
Wie gesagt, Zahlen ist noch ein anderes Problem. Aber was sich in der Liste
noch gut macht, sind Titel (Capitano, Dottore etc.). Also
eben das, was man üblicherweise an Abkürzungen in Strassennamen benutzt.

> Wenn es nun mehrere Möglichkeiten gibt, tragen wir die dann einfach alle
> untereinander ein, z.B. "S." kann sein: "San", "Sant'", "Santa"?

Ja, bitte.

Gruss

Sarah

___
Talk-de mailing list
Talk-de@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Nominatim, Probleme und Merkwürdigkeiten

2015-11-19 Diskussionsfäden Martin Koppenhoefer
Am 19. November 2015 um 13:49 schrieb Sarah Hoffmann :

> Das ist eine echte Falschzuordnung, die in etwa so geht:
> Bekannte Abkürzungen werden auf die Anfrage angewendet, hier via -> v.
> Ergibt sich somit "v gramsci, aquileia". Dann wird die List potentieller
> Hausnummern abgesucht, und da steht 'v' drin. Hausnummern können aber in
> der Anfrage wegfallen, bleibt "gramsci, aquileia" und das passt natürlich
> auf die "Corso Antonio Gramsci, Aquileia".
>


Mir ist jetzt aufgefallen, dass es z.T. mehrere unterschiedliche
Abkürzungen für dasselbe Wort gibt, z.B.
quattro=4
quattro=IV

es gibt übrigens auch den entgegengesetzten Fall,
quarto=IV  (d.h. gleiche Abkürzung mit unterschiedlicher Bedeutung)

Gruß,
Martin
___
Talk-de mailing list
Talk-de@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-de