Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-22 Par sujet Francescu GAROBY
Je finis en ce moment l'ajout du tag 'wikipedia' sur les arrondissements
qui ne l'avaient pas. J'en ai compté à peu près 200.

Pour les cantons, la requête overpass ci-dessous me dit qu'il y en a près
de 2250 à traiter ! Si quelqu'un veut écrire une moulinette capable
d'ajouter le tag 'wikipedia' automatiquement, qu'il ne se gène pas pour le
faire !
(J'ai d'ailleurs remarqué que quelques cantons n'ont pas de 'ref:INSEE', je
vais corriger ça de suite).

osm-script
  query type=relation
has-kv k=boundary v=political/
has-kv k=political_division v=canton/
has-kv k=ref:INSEE regv=./
has-kv k=wikipedia modv=not regv=./
  /query
  print mode=meta/
/osm-script

Francescu


Le 21 mars 2013 20:20, Philippe Verdy verd...@wanadoo.fr a écrit :

 Sur les arrondissements, je crois que les liens y sont tous déjà; pour
 les cantons, comme beaucoup ont été importés massivement il y a
 quelques mois par un bot (qui cherchait les cantons définis uniquement
 par des listes de communes entières, et dont les frontières étaient
 déjà entièrement tracées), il doit manquer certainement des tas de
 liens sur ceux-là sui n'ont pas été revus depuis.

 Méfiance tout de même car j'ai vu un cas (je ne sais plus où, désolé
 je n'ai pas noté car je l'ai corrigé au passage) où le bot avait
 importé un canton en oubliant d'exclure une enclave d'un autre canton,
 provenant d'une commune hors du canton mais dont les frontières
 étaient alors incomplètes et ont été ignorées. En apparence cela
 fermait le canton importé était bien fermé, mais il était trop grand
 en oubliant d'exclure cette enclave avec des membres inner (une
 enclave dont les frontières communales étaient pourtant déjà tracées,
 même si sa commune n'était pas complète ; noter que la commune
 enclavante avait aussi oublié d'exclure cette enclave avec des membres
 inner sans sa propre relation).

 Le 20 mars 2013 22:41, Francescu GAROBY windu...@gmail.com a écrit :
  Pour faire le lien avec le projet du mois, ça vaut le coup d'aller mettre
  les tags wikipedia sur les cantons et arrondissements, selon vous ?




-- 
Cordialement,
Francescu GAROBY
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-21 Par sujet Philippe Verdy
Sur les arrondissements, je crois que les liens y sont tous déjà; pour
les cantons, comme beaucoup ont été importés massivement il y a
quelques mois par un bot (qui cherchait les cantons définis uniquement
par des listes de communes entières, et dont les frontières étaient
déjà entièrement tracées), il doit manquer certainement des tas de
liens sur ceux-là sui n'ont pas été revus depuis.

Méfiance tout de même car j'ai vu un cas (je ne sais plus où, désolé
je n'ai pas noté car je l'ai corrigé au passage) où le bot avait
importé un canton en oubliant d'exclure une enclave d'un autre canton,
provenant d'une commune hors du canton mais dont les frontières
étaient alors incomplètes et ont été ignorées. En apparence cela
fermait le canton importé était bien fermé, mais il était trop grand
en oubliant d'exclure cette enclave avec des membres inner (une
enclave dont les frontières communales étaient pourtant déjà tracées,
même si sa commune n'était pas complète ; noter que la commune
enclavante avait aussi oublié d'exclure cette enclave avec des membres
inner sans sa propre relation).

Le 20 mars 2013 22:41, Francescu GAROBY windu...@gmail.com a écrit :
 Pour faire le lien avec le projet du mois, ça vaut le coup d'aller mettre
 les tags wikipedia sur les cantons et arrondissements, selon vous ?

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Pierre-Alain Dorange
Pieren pier...@gmail.com wrote:

 C'est quand même incroyable de devoir dépendre d'un projet externe
 (wikipedia) qui lui n'hésite pas à nommer les choses par leur nom
 (wikipedia=fr:Arrondissement de Caen) pour compenser les
 tergiversations de quelques contributeurs OSM.

Bon hier soir j'ai expérimenté et j'ai osé nommé l'Arrondissement de
Cognac en Arrondissement de Cognac (au lieu de Cognac) et bien voilà
Nominatim ne s'embrouille plus et la recherche Cognac me retourne
dsormais la ville en premier, suivi de la gare (nommé Cognac
seuelement, faudra-t'il aussi la nommer Gare de Cognac ?) puis la
hameau Cognac qui porte bien son nom.

-- 
Pierre-Alain Dorange
OSM experiences : http://www.leretourdelautruche.com/map/


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Christian Quest
Le 20 mars 2013 08:04, Pierre-Alain Dorange pdora...@mac.com a écrit :
 Bon hier soir j'ai expérimenté et j'ai osé nommé l'Arrondissement de
 Cognac en Arrondissement de Cognac (au lieu de Cognac) et bien voilà
 Nominatim ne s'embrouille plus et la recherche Cognac me retourne
 dsormais la ville en premier, suivi de la gare (nommé Cognac
 seuelement, faudra-t'il aussi la nommer Gare de Cognac ?) puis la
 hameau Cognac qui porte bien son nom.


Ca me semble assez logique d'appeler un chat un chat et donc un
arrondissement un arrondissement.
Toutefois, conserver un libellé simple sans la mention
arrondissement peut aussi être utile (exemple pour une carte des
sous-préfectures et de leur arrondissement où on ne va pas répéter
Arrondissement de sans arrêt).

Pour les gares (ou autre) ça mérite aussi réflexion... et on a un
problème similaire. Lors de telle utilisation Gare de Machin sera
utile (exemple avec Nominatim), mais pour une autre réutilisation
Machin sera nécessaire. Exemple sur un rendu de carte où il y a une
icône qui symbolise la gare, donc où il est inutile de le répéter dans
le texte qui n'a jamais assez de place pour être placé.

Dans tout les cas, il faudrait harmoniser et ne pas perdre de vue ce
qui est fait hors hexagone.

Entre name, official_name, short_name on va bien trouver de quoi
conserver les différentes variantes de nom qui ont chacune une utilité
et qu'on ne peut pas toujours déterminer automatiquement.

-- 
Christian Quest - OpenStreetMap France
Synthèse du Week-end SOTM-FR à Lyon : http://openstreetmap.fr/synthese-sotmfr

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Vincent Pottier

Le 20/03/2013 08:04, Pierre-Alain Dorange a écrit :

Pieren pier...@gmail.com wrote:


C'est quand même incroyable de devoir dépendre d'un projet externe
(wikipedia) qui lui n'hésite pas à nommer les choses par leur nom
(wikipedia=fr:Arrondissement de Caen) pour compenser les
tergiversations de quelques contributeurs OSM.

Bon hier soir j'ai expérimenté et j'ai osé nommé l'Arrondissement de
Cognac en Arrondissement de Cognac (au lieu de Cognac) et bien voilà
Nominatim ne s'embrouille plus et la recherche Cognac me retourne
dsormais la ville en premier, suivi de la gare (nommé Cognac
seuelement, faudra-t'il aussi la nommer Gare de Cognac ?) puis la
hameau Cognac qui porte bien son nom.



Pourquoi faut-il ajouter gare dans le nom alors qu'il y a railway=station
C'est comme porter une ceinture et des bretelles.
Si l’algorithme ne s'y retrouve pas c'est l’algorithme qu'il faut changer.
--
FrViPofm

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Francescu GAROBY
Je rejoins Vincent : les arrondissements comme les gares ne devraient pas
se nommer arrondissement de .../gare de ... ou alors changeons aussi les
communes en commune de ... !

Francescu


Le 20 mars 2013 08:54, Vincent Pottier vpott...@gmail.com a écrit :

 Le 20/03/2013 08:04, Pierre-Alain Dorange a écrit :

  Pieren pier...@gmail.com wrote:

  C'est quand même incroyable de devoir dépendre d'un projet externe
 (wikipedia) qui lui n'hésite pas à nommer les choses par leur nom
 (wikipedia=fr:Arrondissement de Caen) pour compenser les
 tergiversations de quelques contributeurs OSM.

 Bon hier soir j'ai expérimenté et j'ai osé nommé l'Arrondissement de
 Cognac en Arrondissement de Cognac (au lieu de Cognac) et bien voilà
 Nominatim ne s'embrouille plus et la recherche Cognac me retourne
 dsormais la ville en premier, suivi de la gare (nommé Cognac
 seuelement, faudra-t'il aussi la nommer Gare de Cognac ?) puis la
 hameau Cognac qui porte bien son nom.


 Pourquoi faut-il ajouter gare dans le nom alors qu'il y a railway=station
 C'est comme porter une ceinture et des bretelles.
 Si l’algorithme ne s'y retrouve pas c'est l’algorithme qu'il faut changer.
 --
 FrViPofm


 __**_
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.**org/listinfo/talk-frhttp://lists.openstreetmap.org/listinfo/talk-fr




-- 
Cordialement,
Francescu GAROBY
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Christian Quest
Le 20 mars 2013 08:54, Vincent Pottier vpott...@gmail.com a écrit :

 Pourquoi faut-il ajouter gare dans le nom alors qu'il y a railway=station
 C'est comme porter une ceinture et des bretelles.
 Si l’algorithme ne s'y retrouve pas c'est l’algorithme qu'il faut changer.

Il n'est pas toujours possible de calculer ces noms automatiquement et
surtout sans faire d'erreur.

Gare de
Gare du
Gare d'

Gérer correctement les H aspirés ou muets est une galère...

Le diable se cache dans les détails... et les exceptions ;)

-- 
Christian Quest - OpenStreetMap France
Synthèse du Week-end SOTM-FR à Lyon : http://openstreetmap.fr/synthese-sotmfr

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Philippe Verdy
Le 20 mars 2013 09:03, Francescu GAROBY windu...@gmail.com a écrit :
 Je rejoins Vincent : les arrondissements comme les gares ne devraient pas se
 nommer arrondissement de .../gare de ... ou alors changeons aussi les
 communes en commune de ... !

Sans oulier aussi les départements qu portent aussi le nom des
fleuves... Ce renommage qui ne sert qu'à régler un problème de tri des
résutlats sur Nominatim (lequel de toute façon fait parfaitement la
différence dans ses résultats en les affichant bel et bien
différemment même si la requête est ambiguë et fait apparaitre
plusieurs possibilités,) c'est vraiement taguer pour le rendu.

Pas besoin de Arrrondissement de, pas plus que Département de,
Commune de, Région de, Canton de ... même si Nominatim parfois
calcule mal sa pertinence (parce qu'il utilise des règles empiriques
assez farfelues pour son classement, ce qui pourtant n'entraine aucune
confusion).

Wikipédia est obligé de mettre une précision dans son titre car il n'a
pas moyen de faire autrement, chaque titre devant être unique, sinon
il crée une page d'homonymie et oblige l'utilisateur à aller d'abord
sur cette page pour choisir un des liens proposés..

Si un utilisateur fait une recherche sur Nominatim et obtient
plusieurs résulats, et que ces résultats sont justes, mais seulement
pas triés de la façon à laquelle il s'atend simplement parce qu'il ne
sait pas lire ces résultats et voudrait absolument que le seul
résultat qui l'intéresse doit (pour lui seulement) être le premier de
la liste, c'est l'utilisateur qui a un problème... de paresse surtout
(car il n'a surtout pas envie de lire les libellés affichés ni même de
regarder, s'il a un doute, sur le lien détails !

Il n'est pas anormal que Nominatim permette de rechercher plein de
choses : des villes, des arronidissements, des gares, des stations de
bus ou métro. Nominatim les diffférencie sans problème même s'il
affiche plusieurs résultats.

Et puis Nominatim n'est pas le seul concerné, c'est un rendu
particulier. Mêmme l'insee ne met pas Arrondissement de  dans sa
base.

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet JB
 

T't't'… 

Ce n'est toujours pas parce que l'algorithme n'est pas
parfait (aujourd'hui) qu'il faut modifier toute la base en conséquence.
Tagguer pour le rendu, on ne s'en rend plus toujours compte quand on y
est jusqu'au nez (dans le rendu) ? 

JB. 

Le 20.03.2013 09:11,
Christian Quest a écrit : 

 Le 20 mars 2013 08:54, Vincent Pottier
vpott...@gmail.com a écrit :
 
 Pourquoi faut-il ajouter gare dans
le nom alors qu'il y a railway=station C'est comme porter une ceinture
et des bretelles. Si l'algorithme ne s'y retrouve pas c'est l'algorithme
qu'il faut changer.
 
 Il n'est pas toujours possible de calculer ces
noms automatiquement et
 surtout sans faire d'erreur.
 
 Gare de

Gare du
 Gare d'
 
 Gérer correctement les H aspirés ou muets est une
galère...
 
 Le diable se cache dans les détails... et les exceptions
;)

 ___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Vincent Pottier

Le 20/03/2013 09:11, Christian Quest a écrit :

Le 20 mars 2013 08:54, Vincent Pottier vpott...@gmail.com a écrit :

Pourquoi faut-il ajouter gare dans le nom alors qu'il y a railway=station
C'est comme porter une ceinture et des bretelles.
Si l’algorithme ne s'y retrouve pas c'est l’algorithme qu'il faut changer.

Il n'est pas toujours possible de calculer ces noms automatiquement et
surtout sans faire d'erreur.

Gare de
Gare du
Gare d'

Gérer correctement les H aspirés ou muets est une galère...

Le diable se cache dans les détails... et les exceptions ;)


Alors pour chasser le diable, je préférerais un alt_name=Gare d'Ambialet
Je peux en causer à un exorciste... J'en ai un à la maison :-)

http://wiki.openstreetmap.org/wiki/Names#Name_is_the_name_only

N.B. La question se pose aussi pour d'autres objets...
Je tagge les églises en name=Église Saint-Glinglin|Collégiale 
Sainte-Gudule|Abbatiale Saint Propter... et ai un peu standardisé cette 
forme (en évitant la redondance église abbatiale).
Église, Collégiale, Abbatiale, Basilique, Cathédrale sont des titres 
comme Docteur, Professeur donc font tout de même partie du nom (En droit 
canonique chapelle est un titre un peu différent, mais bon... on reste 
simple).
On peut considérer les Collège École primaire... un peu de la même 
façon s'il sont apposés au nom auxquels ces établissements sont 
dédicacés : Collège Paul-Émile Victor


Mais Église de Truc-les-Nemours, ce n'est pas un name... Ni Mairie de 
Truc-les-Nemours, ni Stade de Truc-les-Nemours, ni Gare de 
Truc-les-Nemours, ni Collège de Truc-les-Nemours.
Et encore moins les formes toutes sèches Église, Mairie, Stade, 
Gare, Collège... Pas bien !

--
FrViPofm

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Philippe Verdy
En attendant, on pouvait chercher tous les arrondissements français
par leur nom simple, et c'était bien dans la liste des résultats
retournés par Nominatim.

Mais si maintenant on recherche Cognac, on ne troue plus QUE la
ville et pas l'arrondissement, et c'est... mal.

Le fait que la liste retournée par Nominatim quand on cherche juste
Cognac contienne AUSSI l'arrondissement n'est PAS une anomalie de
Nominatim.

On peut uniquement jouer sur le critère de pertinence pour que la
ville soit listée avant l'arrondissement dans cette liste, et les
moyens pour ça existent déjà. Mais il n'y a strictement aucune raison
de supprimer l'arrondissement de cette liste par le renommage.

Le critère de pertinence est forcément subjectif et dépendant de ce
que recherche l'utilisateur, ce n'est pas à nous de décider que la
ville doit y figurer mais pas l'arrondissement. Mais on peut faire en
sorte que la ville apparaisse en premier sans utiliser ce renommage.

Bref il faut revenir à Cognac pour le name=*.

Les autres considérations comme le fait de composer l'expression
arrondissement de Cognac à partir des infos déjà corrects fournies
sont du traitement linguistique, et cela n'a rien à voir avec ce que
doit contenir et retourner une base de données lors des recherches,
car elle fournit déjà assez d'infos.

On pourrait éventuellement codifier et taguer les traitements
linguistiques possibles, mais si on veut on peut toujours ajouter un
autre tag pour la forme longue. Mais même si on a mis un tag
supplémentaire long_name=Arrondissement de Cognac, il restera encore
le problème de la capitale initiale (malvenue pour l'utilisation dans
une phrase car le mot Arrondissement n'est pas un nom propre) et du
fait qu'il faudra éventuellement contracter un article placé avant
avec une apostrophe (bref cela demanderait encore un traitement
linguistique, spécifique au français, avec sa propre codification de
toute façon si on devait la renseigner aussi dans la base).

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Pierre-Alain Dorange
Vincent Pottier vpott...@gmail.com
wrote:

 Pourquoi faut-il ajouter gare dans le nom alors qu'il y a railway=station
 C'est comme porter une ceinture et des bretelles.
 Si l'algorithme ne s'y retrouve pas c'est l'algorithme qu'il faut changer.

Je pose juste la question, sur ce point c'est pas vraiment génant,
puisque même en l'état actuel si la recherche retourne la gare aussi
elle est pas en premier et il est indiqué Gare dans c'est OK.

-- 
Pierre-Alain Dorange
OSM experiences : http://www.leretourdelautruche.com/map/


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Pierre-Alain Dorange
Philippe Verdy verd...@wanadoo.fr wrote:

 Sans oulier aussi les départements qu portent aussi le nom des
 fleuves... Ce renommage qui ne sert qu'à régler un problème de tri des
 résutlats sur Nominatim (lequel de toute façon fait parfaitement la
 différence dans ses résultats en les affichant bel et bien
 différemment même si la requête est ambiguë et fait apparaitre
 plusieurs possibilités,) c'est vraiement taguer pour le rendu.
 [...]

Je me fais aussi cette remarque c'est un peu comem taguer pour le
rendu en effet, mais c'est aussi un peu plus complexe que cela.

Ta remarque département/fleuve est juste mais pas du même ordre.
personne ne cherchera la rue truc sur le fleuve machin. Par contre la
rue truc dans le département machin oui. Donc a priori pas de réel
problème de recherche dans ce cas.

Par contre pour les communes et arrondissements c'est plus délicat car
il y a le résultat de la recherche strict du nom (ex. Cognac ou Caen) ou
personne (pas même un algorythme) ne pourra lever totalement l'ambiguité
et deviner ce que veut réellement l'utilisateur (même si peu font des
recherches d'arrondissement sans le préciser).

Mais là ou ça se complique c'est dans l'exemple initial ou on associe au
nom de base une rue (par exemple) et là on a plusieurs candidats.
Il y a là une amélioration possible de Nominatim : pour mettre en avant
la ville avant l'arrondissement à priori (et sans artifices comme
ajouter un lien wikipédia).

Mais dans un cadre plus général on peut imaginer une ville et un hameau
avec chacun le même nom de rue et alors qui mettre en premier ? Ou dans
un cadre encore plus général 2 admin_level avec le même nom de rue.
Comment déterminer celui le plus probable... 

C'est un problème complexe et pas totalement soluble par algorythme a
mon avis.
Si wikipédia a pris la solution de nommer explicitement la chose c'est
bien pour une raison, et l'unicité ne suffit pas car les pages
d'homonymie existe pour la plupart de ces cas afin justement de guider.

-- 
Pierre-Alain Dorange
OSM experiences : http://www.leretourdelautruche.com/map/


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Philippe Verdy
Le 20 mars 2013 20:26, Pierre-Alain Dorange pdora...@mac.com a écrit :
 Ta remarque département/fleuve est juste mais pas du même ordre.
 personne ne cherchera la rue truc sur le fleuve machin. Par contre la
 rue truc dans le département machin oui. Donc a priori pas de réel
 problème de recherche dans ce cas.

 Par contre pour les communes et arrondissements c'est plus délicat car
 il y a le résultat de la recherche strict du nom (ex. Cognac ou Caen) ou
 personne (pas même un algorythme) ne pourra lever totalement l'ambiguité
 et deviner ce que veut réellement l'utilisateur (même si peu font des
 recherches d'arrondissement sans le préciser).

Pourtant Nominatim affiche les deux résultats de façon différente
(même s'il n'affiche pas les valeurs d'admin_level, il les interprète
en affichant un type:place:country ou type:place:city car les deux
relations sont importées dans des tables de features avec des
attributs bel et bien différents, et Nominatim les hiérarchise aussi
(pour faciliter les recherches par inclusion d'une région dans une
autre, et pour les afficher **toutes** dans l'ordre, de la plus petite
à la plus grande.

Je ne vois aucune anomalie dans les résultats de Nominatim, même si
l'affichage des résultats (sur le site Nominatim, pas dans sa base)
peut être amélioré (et le tri des résulats dans une liste fait partie
du travail du site, beaucoup plus que de sa base, ce tri se faisant
alors sur un critère de pertinence qui reste totalement empirique,
mais qui n'élimine **aucun** résultat.

Bref il faut savoir lire ces résultats, même si l'affichage du site
peut être amélioré (il le fait déjà par exemple pour les gares en
affichant une icône distinctives à côté du nom, il différencie les
noeuds et les surfaces aussi avec une icône différente, et il fournit
plein d'attributs supplémentaires dans les détails, y compris un lien
Wikipédia qui peut donner des explications et lever l'ambiguïté qui
reste).

Donc renommer des objets pour en faire disparaître certains dans les
résultats de Nominatim est une mauvaise idée. Je persiste que c'est
idiot de faire ça dans la base OSM : les arrondissements français ne
sont **pas** des comtés comme aux USA, ce ne sont pas des
collectivités locales. le mot arrondissement reste un terme
générique, et ne fait pas partie du nom. Les arrondissements ont
nommés par leur nom de commune chef-lieu, ou parfois de deux communes
(p.ex. Fougères-Vitré récemment), ou d'une commune et d'une précision
qui les distingue quand leur chef-lieu est le même (p.ex.
Strasbourg-Ville, Strasbourg-Campagne), et cela suffit pour toutes les
recherches.

Et c'est la même chose aussi en Belgique.

Qu'est-ce qui vous déplait, que le nom d'arrondissement s'affiche
(alors qu'on ne le met typiquement pas dans une adresse postale) ?
Nominatim n'est pas fait pour gérer juste les adresses postales, et
ces ajouts d'informations sont aussi utiles pendant les recherches en
tant que précision visible permettant de choisir entre les résultats
multiples affichés ou confirmer qu'on a bien géolocalisé le bon
endroit. Le seul fait qu'il y ait plusieurs résultats homonymes
affichés (mais avec des précisions supplémentaires pour faire la
différence) montre que ces affichages sont utiles pour lever les
ambiguïtés (c'est aussi utile que sur Wikipédia quand on cherche un
mot et qu'on tombe sur une age d'homonymie pour lever l'ambiguïté en
lasisant le lecteur choisir ce qu'il veut consulter).

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Francescu GAROBY
Pour faire le lien avec le projet du mois, ça vaut le coup d'aller mettre
les tags wikipedia sur les cantons et arrondissements, selon vous ?

Francescu


Le 20 mars 2013 20:47, Philippe Verdy verd...@wanadoo.fr a écrit :

 Le 20 mars 2013 20:26, Pierre-Alain Dorange pdora...@mac.com a écrit :
  Ta remarque département/fleuve est juste mais pas du même ordre.
  personne ne cherchera la rue truc sur le fleuve machin. Par contre la
  rue truc dans le département machin oui. Donc a priori pas de réel
  problème de recherche dans ce cas.
 
  Par contre pour les communes et arrondissements c'est plus délicat car
  il y a le résultat de la recherche strict du nom (ex. Cognac ou Caen) ou
  personne (pas même un algorythme) ne pourra lever totalement l'ambiguité
  et deviner ce que veut réellement l'utilisateur (même si peu font des
  recherches d'arrondissement sans le préciser).

 Pourtant Nominatim affiche les deux résultats de façon différente
 (même s'il n'affiche pas les valeurs d'admin_level, il les interprète
 en affichant un type:place:country ou type:place:city car les deux
 relations sont importées dans des tables de features avec des
 attributs bel et bien différents, et Nominatim les hiérarchise aussi
 (pour faciliter les recherches par inclusion d'une région dans une
 autre, et pour les afficher **toutes** dans l'ordre, de la plus petite
 à la plus grande.

 Je ne vois aucune anomalie dans les résultats de Nominatim, même si
 l'affichage des résultats (sur le site Nominatim, pas dans sa base)
 peut être amélioré (et le tri des résulats dans une liste fait partie
 du travail du site, beaucoup plus que de sa base, ce tri se faisant
 alors sur un critère de pertinence qui reste totalement empirique,
 mais qui n'élimine **aucun** résultat.

 Bref il faut savoir lire ces résultats, même si l'affichage du site
 peut être amélioré (il le fait déjà par exemple pour les gares en
 affichant une icône distinctives à côté du nom, il différencie les
 noeuds et les surfaces aussi avec une icône différente, et il fournit
 plein d'attributs supplémentaires dans les détails, y compris un lien
 Wikipédia qui peut donner des explications et lever l'ambiguïté qui
 reste).

 Donc renommer des objets pour en faire disparaître certains dans les
 résultats de Nominatim est une mauvaise idée. Je persiste que c'est
 idiot de faire ça dans la base OSM : les arrondissements français ne
 sont **pas** des comtés comme aux USA, ce ne sont pas des
 collectivités locales. le mot arrondissement reste un terme
 générique, et ne fait pas partie du nom. Les arrondissements ont
 nommés par leur nom de commune chef-lieu, ou parfois de deux communes
 (p.ex. Fougères-Vitré récemment), ou d'une commune et d'une précision
 qui les distingue quand leur chef-lieu est le même (p.ex.
 Strasbourg-Ville, Strasbourg-Campagne), et cela suffit pour toutes les
 recherches.

 Et c'est la même chose aussi en Belgique.

 Qu'est-ce qui vous déplait, que le nom d'arrondissement s'affiche
 (alors qu'on ne le met typiquement pas dans une adresse postale) ?
 Nominatim n'est pas fait pour gérer juste les adresses postales, et
 ces ajouts d'informations sont aussi utiles pendant les recherches en
 tant que précision visible permettant de choisir entre les résultats
 multiples affichés ou confirmer qu'on a bien géolocalisé le bon
 endroit. Le seul fait qu'il y ait plusieurs résultats homonymes
 affichés (mais avec des précisions supplémentaires pour faire la
 différence) montre que ces affichages sont utiles pour lever les
 ambiguïtés (c'est aussi utile que sur Wikipédia quand on cherche un
 mot et qu'on tombe sur une age d'homonymie pour lever l'ambiguïté en
 lasisant le lecteur choisir ce qu'il veut consulter).

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




-- 
Cordialement,
Francescu GAROBY
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-20 Par sujet Pierre-Alain Dorange
Philippe Verdy verd...@wanadoo.fr wrote:

 [...]
 Qu'est-ce qui vous déplait, que le nom d'arrondissement s'affiche
 (alors qu'on ne le met typiquement pas dans une adresse postale) ?

Pour faire court (mais je suis d'accord avec ce que tu dis plus haut, on
tagge pas pour le rendu, ni la recherche) :

Dans l'exemple que je prenais au départ (une recherche Cognac), le
résultat retourné est pas explicite puisque Nominatim retourne en tête
l'arrondissement, suivi de la ville sans précision. Les 2 sont
identiques à l'écran (sur le site OSM et sur le site Nominatim).
On arrive a comprendre la différence uniquement en consultant les
détails Nominatim (voir mon autre enfilade ouverte hier pour plus de
détails).

Le premier étant l'arrondissement, la carte proposée pointe en pleine
campagne (le centre de l'arrondissement) et on voit pas la ville de
Cognac à l'écran... 

Certes c'est plus un problème de hiérarchisation des résultats Nominatim
(je suis d'accord et je l'ai dis moi même hier) mais le résultat reste
étrange.

C'est tout.

-- 
Pierre-Alain Dorange
OSM experiences : http://www.leretourdelautruche.com/map/


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Francescu GAROBY
J'ai ouvert un ticket hier soir, et ai déjà eu ma réponse (et la
correction) : https://trac.openstreetmap.org/ticket/4811
Si je comprends bien, la présence du tag wikipedia a plus d'importance que
la valeur du tag admin_level (qui n'est absolument pas abordé dans la
réponse) ? C'est bon à savoir pour le projet du mois ;-)

Francescu


Le 18 mars 2013 17:35, Philippe Verdy verd...@wanadoo.fr a écrit :

 2013/3/18 Pieren pier...@gmail.com:
  2013/3/18 Francescu GAROBY windu...@gmail.com:
  Y a un ersatz d'explications ici :
  http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview
 
  Vi, je connais. C'est une doc à la verdy_p:
  Search Algorithm
  TODO

 Je n'y suis pour tien du tout !

  En creusant un peu, je trouve les requêtes ici mais le code est
 imbuvable:
  https://github.com/twain47/Nominatim/blob/master/website/search.php
 
  Je vais essayer de m'y plonger sans me noyer... On voit bien deux
  order by importance desc.
  D'un autre côté, les notes de la version 2 disent search logic in
  java (http://wiki.openstreetmap.org/wiki/Nominatim/Version2).
  Comprenne qui pourra.

 Effectivement c'est imbuvable, mais avant de se demander comment il
 fonctionne il faut savoir comment le code d'importation de ses tables
 Gazetteer mappe les tags OSM en features Gazetteer. Je ne vois rien
 dans ce code qui semble indiquer qu'il gère les quartiers de villes ;
 les arrondissements français en revanche devraient être traités comme
 les place=county aux USA, c'est à priori le même admin_level=7.

 Mais dans ce paquet infâme et illisible d'expressions régulières
 (surtout destiné à gérer les règles orthographiques de la toponymie et
 les hiérarchies administratives des pays anglophones, avec des
 exceptions incluses pour les germanophones et des hacks avoués pour
 l'Etat de New York), qui sait ce que cela fait en France, même si on
 fait une recherche Nominatim en anglais (je n'ai pas testé si les
 résultats sont différents, à priori cela ne devrait pas l'être au
 niveau des sélections et tris de résultats) !

 Assez souvent, pour le guider il faut ajouter des tags d'annotation
 lui permettant de classer certains éléments correctement.

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




-- 
Cordialement,
Francescu GAROBY
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Philippe Verdy
Une règle qui frise l'empririsme total... Je ne vois pas en quoi un
lien vers un article Wikipédia est pertinent pour trouver une adresse
! Alors que l'admin_level est évidemment bien plus important.

Le 19 mars 2013 08:17, Francescu GAROBY windu...@gmail.com a écrit :
 J'ai ouvert un ticket hier soir, et ai déjà eu ma réponse (et la
 correction) : https://trac.openstreetmap.org/ticket/4811
 Si je comprends bien, la présence du tag wikipedia a plus d'importance que
 la valeur du tag admin_level (qui n'est absolument pas abordé dans la
 réponse) ? C'est bon à savoir pour le projet du mois ;-)

 Francescu


 Le 18 mars 2013 17:35, Philippe Verdy verd...@wanadoo.fr a écrit :

 2013/3/18 Pieren pier...@gmail.com:
  2013/3/18 Francescu GAROBY windu...@gmail.com:
  Y a un ersatz d'explications ici :
  http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview
 
  Vi, je connais. C'est une doc à la verdy_p:
  Search Algorithm
  TODO

 Je n'y suis pour tien du tout !

  En creusant un peu, je trouve les requêtes ici mais le code est
  imbuvable:
  https://github.com/twain47/Nominatim/blob/master/website/search.php
 
  Je vais essayer de m'y plonger sans me noyer... On voit bien deux
  order by importance desc.
  D'un autre côté, les notes de la version 2 disent search logic in
  java (http://wiki.openstreetmap.org/wiki/Nominatim/Version2).
  Comprenne qui pourra.

 Effectivement c'est imbuvable, mais avant de se demander comment il
 fonctionne il faut savoir comment le code d'importation de ses tables
 Gazetteer mappe les tags OSM en features Gazetteer. Je ne vois rien
 dans ce code qui semble indiquer qu'il gère les quartiers de villes ;
 les arrondissements français en revanche devraient être traités comme
 les place=county aux USA, c'est à priori le même admin_level=7.

 Mais dans ce paquet infâme et illisible d'expressions régulières
 (surtout destiné à gérer les règles orthographiques de la toponymie et
 les hiérarchies administratives des pays anglophones, avec des
 exceptions incluses pour les germanophones et des hacks avoués pour
 l'Etat de New York), qui sait ce que cela fait en France, même si on
 fait une recherche Nominatim en anglais (je n'ai pas testé si les
 résultats sont différents, à priori cela ne devrait pas l'être au
 niveau des sélections et tris de résultats) !

 Assez souvent, pour le guider il faut ajouter des tags d'annotation
 lui permettant de classer certains éléments correctement.

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




 --
 Cordialement,
 Francescu GAROBY

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Pierre-Alain Dorange
Philippe Verdy verd...@wanadoo.fr wrote:

  Bien du courage pour expliquer à Brian Quinion pourquoi la France
  ferait exception dans Nominatim.
 
 Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon
 de calculer la sélectivité (puisqu'il ne tient pas compte de
 l'admin_level). Pas la peine de surcharger les noms pour autant.

Je suis pas sur... Le soucis a mon sens provient vraiment de l'homonymie
Caen (Ville) et Caen (Arrondissement). 
Nominatim n'a aucun moyen de savoir qui privilégier et même il faudrai
privilégier l'arrondissement car d'admin_level plus faible donc de sens
plus large.
De même qui (si ça existe) il faudrait privilégier a priori une
recherche sur une région plutot que sur une ville ou un quartier (qui
aurait le même nom)...

Je sais pas si je suis très clair.

Je rencontre exactement le même problème (je viens du publier mon soucis
avant le lire cette enfilade... erreur fatale).
Et dans mon cas (Cognac) je ne vois pas d'autres solutions que d'aider
nominatim en précisant la dénomination, et donc en ajoutant
Arrondissement de Cognac à l'admin_level 7.

Prenons un cas purement théorique (pour éviter de se focaliser sur un
exemple) ou on aurait tout les niveaux admin_level avec le même nom
(c'est con mais c'est un exemple pour pousser l'algorythme à bout).
Si l'utilisateur fait un recherche sur le simple nom, que faut-t'il
privilégier ? Le pays, la région, le département, la ville ou le
quartier... Que cherche l'utilisateur ?

Et dans le cas ou la recherche c'est nom d'une rue, xxx il est
probable que cette rue existe de nombreuse fois dans le pays, que
chercher vraiment l'utilisateur... le plus haut niveau (pays) ou le plus
bas (quartier) ?

Je suis pas sur qu'il y ait de réponse simple...


-- 
Pierre-Alain Dorange
OSM experiences : http://www.leretourdelautruche.com/map/


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Pierre-Alain Dorange
Francescu GAROBY windu...@gmail.com
wrote:

 J'ai ouvert un ticket hier soir, et ai déjà eu ma réponse (et la
 correction) : https://trac.openstreetmap.org/ticket/4811
 Si je comprends bien, la présence du tag wikipedia a plus d'importance que
 la valeur du tag admin_level (qui n'est absolument pas abordé dans la
 réponse) ? C'est bon à savoir pour le projet du mois ;-)

Ce qui ne résoudra rien quand on aura mis des liens wikipédia a tout les
niveaux...

-- 
Pierre-Alain Dorange
OSM experiences : http://www.leretourdelautruche.com/map/


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Philippe Verdy
Nominatim n'affiche pas les résultats de la même façon : il indique
bien le type de relation (place=country, place=city...) Il se trouve
que le site web a évolué entre temps et que dans la liste des
résultats parmi ceux qu'on peut choisir, il ne précise plus rien (il
faut consulter le détail). Nominatim lui-m^rme n'est pas en cause,
mais ici c'est plutôt le site web gérant le formulaire de recherche
dans la base Nominatim.
Si je fais la recherche Nominatim dans JOSM, on a encore les détails
nécessaires dans les listes de résultats.
Si Nominatim était clair, il ne devrait pas afficher la ville ou
l'arrondissement tout seul mais toujours les indiquer avec leur
adresse complète (du plus fin au plus large) et dans ce cas la
différence est manifeste.
Nominatim n'a effectivement pas à choisir, mais il doit trier les
résulats multiples selon un critère de pertinence (et dans ce cas il
risque de ne pas tout afficher sur la même page s'il y a trop de
résultats.
Tant qu'il abrège pas ses résultats en n'indiquant QUE le nom
recherché et pas dans quoi il se situe, il n'y a pas de confusion
possible.

Le 19 mars 2013 19:47, Pierre-Alain Dorange pdora...@mac.com a écrit :
 Philippe Verdy verd...@wanadoo.fr wrote:

  Bien du courage pour expliquer à Brian Quinion pourquoi la France
  ferait exception dans Nominatim.

 Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon
 de calculer la sélectivité (puisqu'il ne tient pas compte de
 l'admin_level). Pas la peine de surcharger les noms pour autant.

 Je suis pas sur... Le soucis a mon sens provient vraiment de l'homonymie
 Caen (Ville) et Caen (Arrondissement).
 Nominatim n'a aucun moyen de savoir qui privilégier et même il faudrai
 privilégier l'arrondissement car d'admin_level plus faible donc de sens
 plus large.
 De même qui (si ça existe) il faudrait privilégier a priori une
 recherche sur une région plutot que sur une ville ou un quartier (qui
 aurait le même nom)...

 Je sais pas si je suis très clair.

 Je rencontre exactement le même problème (je viens du publier mon soucis
 avant le lire cette enfilade... erreur fatale).
 Et dans mon cas (Cognac) je ne vois pas d'autres solutions que d'aider
 nominatim en précisant la dénomination, et donc en ajoutant
 Arrondissement de Cognac à l'admin_level 7.

 Prenons un cas purement théorique (pour éviter de se focaliser sur un
 exemple) ou on aurait tout les niveaux admin_level avec le même nom
 (c'est con mais c'est un exemple pour pousser l'algorythme à bout).
 Si l'utilisateur fait un recherche sur le simple nom, que faut-t'il
 privilégier ? Le pays, la région, le département, la ville ou le
 quartier... Que cherche l'utilisateur ?

 Et dans le cas ou la recherche c'est nom d'une rue, xxx il est
 probable que cette rue existe de nombreuse fois dans le pays, que
 chercher vraiment l'utilisateur... le plus haut niveau (pays) ou le plus
 bas (quartier) ?

 Je suis pas sur qu'il y ait de réponse simple...


 --
 Pierre-Alain Dorange
 OSM experiences : http://www.leretourdelautruche.com/map/


 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Francescu GAROBY
Non, parce que le tag Wikipedia pour l'arrondissement de Caen est
wikipedia=fr:Arrondissement de Caen. Et tous les articles vers les
arrondissements de France sont conçus de cette façon.

Francescu


Le 19 mars 2013 19:47, Pierre-Alain Dorange pdora...@mac.com a écrit :

 Francescu GAROBY windu...@gmail.com
 wrote:

  J'ai ouvert un ticket hier soir, et ai déjà eu ma réponse (et la
  correction) : https://trac.openstreetmap.org/ticket/4811
  Si je comprends bien, la présence du tag wikipedia a plus d'importance
 que
  la valeur du tag admin_level (qui n'est absolument pas abordé dans la
  réponse) ? C'est bon à savoir pour le projet du mois ;-)

 Ce qui ne résoudra rien quand on aura mis des liens wikipédia a tout les
 niveaux...

 --
 Pierre-Alain Dorange
 OSM experiences : http://www.leretourdelautruche.com/map/


 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




-- 
Cordialement,
Francescu GAROBY
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Francescu GAROBY
Oui, mais une rue (comme celle que je cherchais) qui se trouve dans la
commune de Caen, se trouve forcément dans l'arrondissement de Caen, alors
que les autres solutions proposées ne sont *que* dans l'arrondissement de
Caen. On pourrait alors penser qu'en tapant rue Eugène Boudin, Caen, il
vaudrait mieux privilégier le cas où Caen désigne commune
*et*arrondissement, car il remplit plus de conditions que les autres
résultats.
Autre raison : on cherche plus souvent une adresse dans une commune qu'une
adresse dans un arrondissement (qui connait vraiment les limites des
arrondissements ?).

Francescu


Le 19 mars 2013 19:47, Pierre-Alain Dorange pdora...@mac.com a écrit :

 Philippe Verdy verd...@wanadoo.fr wrote:

   Bien du courage pour expliquer à Brian Quinion pourquoi la France
   ferait exception dans Nominatim.
 
  Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon
  de calculer la sélectivité (puisqu'il ne tient pas compte de
  l'admin_level). Pas la peine de surcharger les noms pour autant.

 Je suis pas sur... Le soucis a mon sens provient vraiment de l'homonymie
 Caen (Ville) et Caen (Arrondissement).
 Nominatim n'a aucun moyen de savoir qui privilégier et même il faudrai
 privilégier l'arrondissement car d'admin_level plus faible donc de sens
 plus large.
 De même qui (si ça existe) il faudrait privilégier a priori une
 recherche sur une région plutot que sur une ville ou un quartier (qui
 aurait le même nom)...

 Je sais pas si je suis très clair.

 Je rencontre exactement le même problème (je viens du publier mon soucis
 avant le lire cette enfilade... erreur fatale).
 Et dans mon cas (Cognac) je ne vois pas d'autres solutions que d'aider
 nominatim en précisant la dénomination, et donc en ajoutant
 Arrondissement de Cognac à l'admin_level 7.

 Prenons un cas purement théorique (pour éviter de se focaliser sur un
 exemple) ou on aurait tout les niveaux admin_level avec le même nom
 (c'est con mais c'est un exemple pour pousser l'algorythme à bout).
 Si l'utilisateur fait un recherche sur le simple nom, que faut-t'il
 privilégier ? Le pays, la région, le département, la ville ou le
 quartier... Que cherche l'utilisateur ?

 Et dans le cas ou la recherche c'est nom d'une rue, xxx il est
 probable que cette rue existe de nombreuse fois dans le pays, que
 chercher vraiment l'utilisateur... le plus haut niveau (pays) ou le plus
 bas (quartier) ?

 Je suis pas sur qu'il y ait de réponse simple...


 --
 Pierre-Alain Dorange
 OSM experiences : http://www.leretourdelautruche.com/map/


 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




-- 
Cordialement,
Francescu GAROBY
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Pierre-Alain Dorange
Francescu GAROBY windu...@gmail.com
wrote:

 Non, parce que le tag Wikipedia pour l'arrondissement de Caen est
 wikipedia=fr:Arrondissement de Caen. Et tous les articles vers les
 arrondissements de France sont conçus de cette façon.

Donc wikipdia a résolu ce même problème nommant l'arrondissement Caen
en Arrondissement de Caen... pourquoi pas faire de même chez nous ?

-- 
Pierre-Alain Dorange
OSM experiences : http://www.leretourdelautruche.com/map/


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Pierre-Alain Dorange
Philippe Verdy verd...@wanadoo.fr wrote:

 Nominatim n'affiche pas les résultats de la même façon : il indique
 bien le type de relation (place=country, place=city...) Il se trouve
 que le site web a évolué entre temps et que dans la liste des
 résultats parmi ceux qu'on peut choisir, il ne précise plus rien (il
 faut consulter le détail). Nominatim lui-m^rme n'est pas en cause,
 mais ici c'est plutôt le site web gérant le formulaire de recherche
 dans la base Nominatim.
 Si je fais la recherche Nominatim dans JOSM, on a encore les détails
 nécessaires dans les listes de résultats.
 Si Nominatim était clair, il ne devrait pas afficher la ville ou
 l'arrondissement tout seul mais toujours les indiquer avec leur
 adresse complète (du plus fin au plus large) et dans ce cas la
 différence est manifeste.
 Nominatim n'a effectivement pas à choisir, mais il doit trier les
 résulats multiples selon un critère de pertinence (et dans ce cas il
 risque de ne pas tout afficher sur la même page s'il y a trop de
 résultats.
 Tant qu'il abrège pas ses résultats en n'indiquant QUE le nom
 recherché et pas dans quoi il se situe, il n'y a pas de confusion
 possible.

Nominatim tri par pertinence (on voit ce paramètre sur la page détail),
c'est le calcul de ce paramètre qui est délicat.

Si je compare Caen et Cognac (mon exemple) j'obtiens

Caen (ville, admin 8)
Importance : 0.64
Il y a un lien wikipédia, 
mais aussi capital, city et population
Caen (arrondissement, admin 7)
Importance : 0.39
Il y a un lien wikipédia

et l'odre est logique (ville, puis arrondissement)

Par contre pour Cognac j'ai :

Cognac (arrondissement)
Importance : 0.35
pas de lien wikipédia
mais un tag population
Cognac (ville)
Importance : 0.52
pas de lien wikipédia

Donc a priori j'aurai tendance a dire (mais rien de scientifique), que
le lien wikipédia a peu d'importance (si il est le même entre la ville
et l'arrondissement ; avec ou sans)
Que la population ne permet pas de privilégier l'un ou l'autre et que
par défaut Nominatim met en avant l'admin_level de plus faible (donc le
plus grand)

Ce qui permettrait a Caen de bien s'ordonner c'est l'ajout de capital ou
city...

Mais bon en même j'ai l'impression de tagger pour le rendu
-- 
Pierre-Alain Dorange
OSM experiences : http://www.leretourdelautruche.com/map/


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Philippe Verdy
Oui mais on peut aussi chercher une ville (voir un village ou
lieu-dit) dans un arrondissement, un département, une région, un pays,
un continent. Toute précision ajoutée sert de filtre supplémentaire.
Mais c'est vrai qu'un résultat où Caen appreit deux fois (celui
affichant la ville et l'arrondissement, et pas seulement
l'arrondissement) sera toujours plus pertinent.

Maintenant que se passe-t-il si on cherche rue de Cherbourg, Caen ?
Nominatim voit une recherche de Cherbourg et de Caen, il peut trouver
une rue de Caen à Cherbourg ou une rue de Cherbourg à Caen et peut
tout autant chercher dans une ville des deux villes ou dans un des
deux arrondissements. Il n'y a pas de placement évident, sauf que
cette fois Nominatim dispose d'une info : la rercherche mentionne en
géréral les mots dnas un ordre comparable à une adresse et donc si on
a précisé rue de , le nom qui suit est important à assirer avec
rue et non avec le mot suivant qui est une autre ville.
Nominatim devrait donc avoir des règles lui permettant de reconnaitre
certaines associations dans un ordre précis. (rue de ne s'associe
qu'avec les mots les plus proches dans la chaine de recherche avant
les mots les plus éloignés)

Eh bien même dans ce cas rue de Cherbourg, Caen devrait bien
chercher une rue de Cherbourg et non une rue de Caen. sachant
ensuite qu'on a ajouté une autre précision Caen, celle-ci n'est plus
associée à rue de. La rue de Cherbourg trouvée étant trouvée,
Nominatim doit chercher la précision la plus proche et ce ne peut être
en priorité que la ville et non un arrondissment.

Le malheur dans tout ça est que les noms de rues ou routes n'oéissent
pas au schéma hiérarchique  et peuvent s'étendre sur toute une série
de communes voire un département entier ou plusieurs régions (par
exemple RN137), même si rapidement il n'y a plus moyen de gérer une
numérotation. Où chercher alors cette rue/route ? Dans une ville ? un
arrondissement, un département, une région ?

Ce n'est pas simple mais si on a le choix, les résultats concernant
les zones de recherche les plus petites sont plus pertinents tout de
même.

Bref utiliser wikipedia=* ne sert à rien, il est plus là pour gêner
qu'autre chose. Ce n'est pas un critère valable.

Le 19 mars 2013 20:03, Francescu GAROBY windu...@gmail.com a écrit :
 Oui, mais une rue (comme celle que je cherchais) qui se trouve dans la
 commune de Caen, se trouve forcément dans l'arrondissement de Caen, alors
 que les autres solutions proposées ne sont que dans l'arrondissement de
 Caen. On pourrait alors penser qu'en tapant rue Eugène Boudin, Caen, il
 vaudrait mieux privilégier le cas où Caen désigne commune et arrondissement,
 car il remplit plus de conditions que les autres résultats.
 Autre raison : on cherche plus souvent une adresse dans une commune qu'une
 adresse dans un arrondissement (qui connait vraiment les limites des
 arrondissements ?).

 Francescu


 Le 19 mars 2013 19:47, Pierre-Alain Dorange pdora...@mac.com a écrit :

 Philippe Verdy verd...@wanadoo.fr wrote:


   Bien du courage pour expliquer à Brian Quinion pourquoi la France
   ferait exception dans Nominatim.
 
  Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon
  de calculer la sélectivité (puisqu'il ne tient pas compte de
  l'admin_level). Pas la peine de surcharger les noms pour autant.

 Je suis pas sur... Le soucis a mon sens provient vraiment de l'homonymie
 Caen (Ville) et Caen (Arrondissement).
 Nominatim n'a aucun moyen de savoir qui privilégier et même il faudrai
 privilégier l'arrondissement car d'admin_level plus faible donc de sens
 plus large.
 De même qui (si ça existe) il faudrait privilégier a priori une
 recherche sur une région plutot que sur une ville ou un quartier (qui
 aurait le même nom)...

 Je sais pas si je suis très clair.

 Je rencontre exactement le même problème (je viens du publier mon soucis
 avant le lire cette enfilade... erreur fatale).
 Et dans mon cas (Cognac) je ne vois pas d'autres solutions que d'aider
 nominatim en précisant la dénomination, et donc en ajoutant
 Arrondissement de Cognac à l'admin_level 7.

 Prenons un cas purement théorique (pour éviter de se focaliser sur un
 exemple) ou on aurait tout les niveaux admin_level avec le même nom
 (c'est con mais c'est un exemple pour pousser l'algorythme à bout).
 Si l'utilisateur fait un recherche sur le simple nom, que faut-t'il
 privilégier ? Le pays, la région, le département, la ville ou le
 quartier... Que cherche l'utilisateur ?

 Et dans le cas ou la recherche c'est nom d'une rue, xxx il est
 probable que cette rue existe de nombreuse fois dans le pays, que
 chercher vraiment l'utilisateur... le plus haut niveau (pays) ou le plus
 bas (quartier) ?

 Je suis pas sur qu'il y ait de réponse simple...


 --
 Pierre-Alain Dorange
 OSM experiences : http://www.leretourdelautruche.com/map/


 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 

Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Christian Quest
Le 19 mars 2013 20:03, Francescu GAROBY windu...@gmail.com a écrit :
 Oui, mais une rue (comme celle que je cherchais) qui se trouve dans la
 commune de Caen, se trouve forcément dans l'arrondissement de Caen, alors
 que les autres solutions proposées ne sont que dans l'arrondissement de
 Caen. On pourrait alors penser qu'en tapant rue Eugène Boudin, Caen, il
 vaudrait mieux privilégier le cas où Caen désigne commune et arrondissement,
 car il remplit plus de conditions que les autres résultats.

Entièrement d'accord sur ce point, le résultat a des chances d'être
plus pertinent si il y a cumul.


 Autre raison : on cherche plus souvent une adresse dans une commune qu'une
 adresse dans un arrondissement (qui connait vraiment les limites des
 arrondissements ?).


C'est pas si évident que ça...

Nominatim classe chaque toponyme par niveau, en reprenant les
admin_level et en descendant encore plus bas.
Si on considère qu'un niveau admin plus local est prioritaire, une rue
se trouvant dans un hameau portant le même nom qu'une grande ville
sortira en premier.
D'où l'idée d'utiliser wikipédia pour tenter de déterminer
l'importance d'un toponyme qui permet de dire que le nom d'un hameau
est moins important que le nom d'une ville dans le cas des homonymes.

Le cas des homonymes de Cognac est intéressant... rue de l'église,
Cognac - c'est bien la ville de Cognac qui devrait sortir avant un
éventuel hameau portant le même nom et ayant aussi une rue de
l'église... enfin, il me semble, non ?

Il ne faut pas oublier non plus que les admin_level sont différents
d'un pays à l'autre et les conventions d'adressage aussi... et que
Nominatim essaye de gérer tout ça de façon globale.

-- 
Christian Quest - OpenStreetMap France
Synthèse du Week-end SOTM-FR à Lyon : http://openstreetmap.fr/synthese-sotmfr

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Vincent de Chateau-Thierry



Le 19/03/2013 20:43, Christian Quest a écrit :

Le 19 mars 2013 20:03, Francescu GAROBY windu...@gmail.com a écrit :

Oui, mais une rue (comme celle que je cherchais) qui se trouve dans la
commune de Caen, se trouve forcément dans l'arrondissement de Caen, alors
que les autres solutions proposées ne sont que dans l'arrondissement de
Caen. On pourrait alors penser qu'en tapant rue Eugène Boudin, Caen, il
vaudrait mieux privilégier le cas où Caen désigne commune et arrondissement,
car il remplit plus de conditions que les autres résultats.


Entièrement d'accord sur ce point, le résultat a des chances d'être
plus pertinent si il y a cumul.



Autre raison : on cherche plus souvent une adresse dans une commune qu'une
adresse dans un arrondissement (qui connait vraiment les limites des
arrondissements ?).


Le sous-préfet ? :-)



Il ne faut pas oublier non plus que les admin_level sont différents
d'un pays à l'autre et les conventions d'adressage aussi... et que
Nominatim essaye de gérer tout ça de façon globale.

En effet, et ce dernier point reste à mon avis un des noeuds du 
problème. Chaque pays a sa propre logique d'imbrication des zones, 
d'ailleurs pas forcément administratives (penser aux zones postales aux 
USA par ex.).

En observant les tableaux de cette page :
http://wiki.openstreetmap.org/wiki/Tag:boundary%3Dadministrative
on peut constater que chaque pays fait son marché parmi les 10 voire 11 
niveaux conventionnels. Aucun niveau (= aucune colonne) n'est utilisé à 
100% hormis le 2 (frontières de pays). Par suite, traiter uniformément 
(à quelques hacks près) tous les pays donne nécessairement des résultats 
discutables, selon le pays. L'importance donnée chez nous aux 
arrondissements (de part leur admin_level) par le moteur en est une 
illustration : le focus est mis sur la valeur d'admin_level, et non sur 
l'usage, qui en France occulte ce niveau, encadré qu'il est par deux 
niveaux très discriminants et utilisés en permanence : commune et 
département.


vincent

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-19 Par sujet Pieren
2013/3/19 Christian Quest cqu...@openstreetmap.fr:
 On pourrait alors penser qu'en tapant rue Eugène Boudin, Caen, il
 vaudrait mieux privilégier le cas où Caen désigne commune et arrondissement,
 car il remplit plus de conditions que les autres résultats.

 Entièrement d'accord sur ce point, le résultat a des chances d'être
 plus pertinent si il y a cumul.

Je crois rêver quand je lis ce genre de commentaires. Qui connait les
noms des arrondissements ? Qui connait les limites des arrondissements
? Qui connait les arrondissements comme subdivision administrative en
dehors des arrondissements de Paris, Lyon et Marseille : oups,
pardn, c'est pas les mêmes 
Sur un million de gens qui cherchent la rue Boudin à Caen, combien
pensent à l'arrondissement de Caen ? 2 ? 3 ? 1 ? aucun ? Il faut
savoir parfois revenir dans le vrai monde IRL...
On croit entendre un sketch du très grand Raymond Devos :
- Pour Caen, quelle heure ? - pour où ? - Pour Caen - Comment
voulez-vous que je vous dise quand, si je ne sais pas où ?

C'est quand même incroyable de devoir dépendre d'un projet externe
(wikipedia) qui lui n'hésite pas à nommer les choses par leur nom
(wikipedia=fr:Arrondissement de Caen) pour compenser les
tergiversations de quelques contributeurs OSM.

Pieren

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


[OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Francescu GAROBY
Bonjour,
En cherchant rue Eugène Boudin, Caen, sur www.openstreetmap.org, je me
rends compte que Nominatim ne classe pas les résultats selon leur
pertinence (ou le fait mal).
En effet, le résultat qui m'intéresse (et qui est le bon) apparait en 3ème
position, cf. ci-dessous :

* Rue résidentielle Rue Eugène Boudin, May-sur-Orne, Caen, Calvados,
Basse-Normandie, 14320, France
* Rue résidentielle Rue Eugène Boudin, Saint-Martin-de-Fontenay, Caen,
Calvados, Basse-Normandie, 14320, France
* *Route tertiaire Rue Eugène Boudin, Verte Vallée, Caen, Calvados,
Basse-Normandie, 14000, France, European Union*

Les deux premiers sont des rues dans d'autres communes que celle qui
m'intéresse *et que j'ai explicitement indiquée dans la demande*.
Par contre, les 3 communes font partie de l'arrondissement de Caen (et donc
du même département, même région, ...). et les deux premiers résultats sont
des rues résidentielles. Les causes de ce tri se situeraient-elles là ?

Ou je suis bon pour ouvrir un bug ?

Francescu
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Philippe Verdy
Intéresse-toi à la valeur admin_level indiquée pour Vallée Verte :
ce devrait être un quartier (admin_level=10) et non une commune
(admin_level=8) comme les 2 autres (May-sur-Orne,
Saint-Martin-de-Fontenay).

Note que la recherche trouve Caen malgré tout en tant que nom
d'arrondissement (admin_level=7 mais normalement moins pertinent).

Il est possible aussi que les frontières du quartier Vallée Verte
soient brisées (non fermées) et qu'alors Nominatim utilise une
heuristique basée sur les distances à un noeud place pour tenter de
devenir son admin_level, cette heuristique peut parfois échouer et
peut conduire à mal calculer la pertinence.

Attnetion: Nominatim ne met pas sa base à jour entièrement en continu,
il peut donc y avoir un décalage avec ce qui est dans la base OSM. Et
parfois il lui arrive de garder très longtemps des infos obsolètes sur
d'anciennes relations qui n'existent plus et qu'il ne retrouve plus
jamais dans aucune mise à jour, parce qu'il a omis de traiter une
suppression d'objet : vérifie donc les relations concernées, pour voir
si elles sont toutes correctement fermées et taguées correctement,
fais les corrections nécessaires, puis attends une bonne semaine pour
vérifier si Nominatim a bien pris en compte les modifs. Si cela est
lié à des infos obsolètes dans sa basen ouvre un ticket sur Nominatim
pour demander un nettoyage (cela peut prendre du temps).

Le 18 mars 2013 11:31, Francescu GAROBY f.gar...@gmail.com a écrit :
 En cherchant rue Eugène Boudin, Caen, sur www.openstreetmap.org, je me
 rends compte que Nominatim ne classe pas les résultats selon leur pertinence
 (ou le fait mal).
 En effet, le résultat qui m'intéresse (et qui est le bon) apparait en 3ème
 position, cf. ci-dessous :
 * Rue résidentielle Rue Eugène Boudin, May-sur-Orne, Caen, Calvados,
 Basse-Normandie, 14320, France
 * Rue résidentielle Rue Eugène Boudin, Saint-Martin-de-Fontenay, Caen,
 Calvados, Basse-Normandie, 14320, France
 * Route tertiaire Rue Eugène Boudin, Verte Vallée, Caen, Calvados,
 Basse-Normandie, 14000, France, European Union

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Christian Quest
En regardant le détail des résultats Nominatim, on voit bien qu'il y a
une petite différence.

Pour le résultat espéré:
http://nominatim.openstreetmap.org/details.php?place_id=94524123

Nominatim a bien rangé cette rue dans la ville et l'arrondissement de
Caen, mais ne semble pas le retourner en priorité par rapport aux deux
autres résultats qui sont uniquement dans l'arrondissement de Caen :

http://nominatim.openstreetmap.org/details.php?place_id=73716808
http://nominatim.openstreetmap.org/details.php?place_id=93907448

mais quand même avant ces 2 autres...

http://nominatim.openstreetmap.org/details.php?place_id=87769797
http://nominatim.openstreetmap.org/details.php?place_id=52401589

Ca vaut le coup d'un rapport de bug à mon avis en indiquant les liens
ci-dessus...


Le 18 mars 2013 11:31, Francescu GAROBY f.gar...@gmail.com a écrit :
 Bonjour,
 En cherchant rue Eugène Boudin, Caen, sur www.openstreetmap.org, je me
 rends compte que Nominatim ne classe pas les résultats selon leur pertinence
 (ou le fait mal).
 En effet, le résultat qui m'intéresse (et qui est le bon) apparait en 3ème
 position, cf. ci-dessous :

 * Rue résidentielle Rue Eugène Boudin, May-sur-Orne, Caen, Calvados,
 Basse-Normandie, 14320, France
 * Rue résidentielle Rue Eugène Boudin, Saint-Martin-de-Fontenay, Caen,
 Calvados, Basse-Normandie, 14320, France
 * Route tertiaire Rue Eugène Boudin, Verte Vallée, Caen, Calvados,
 Basse-Normandie, 14000, France, European Union

 Les deux premiers sont des rues dans d'autres communes que celle qui
 m'intéresse et que j'ai explicitement indiquée dans la demande.
 Par contre, les 3 communes font partie de l'arrondissement de Caen (et donc
 du même département, même région, ...). et les deux premiers résultats sont
 des rues résidentielles. Les causes de ce tri se situeraient-elles là ?

 Ou je suis bon pour ouvrir un bug ?

 Francescu

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




-- 
Christian Quest - OpenStreetMap France
Synthèse du Week-end SOTM-FR à Lyon : http://openstreetmap.fr/synthese-sotmfr

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Vincent de Chateau-Thierry
Bonjour,

 De : Christian Quest 

 
 Ca vaut le coup d'un rapport de bug à mon avis en indiquant les liens
 ci-dessus...
 

D'accord avec ça. C'est (indirectement) ce qu'on évoquait en février au sujet, 
déjà, des
arrondissements [1]. Ce niveau admin (niveau 7) devrait être occulté par 
Nominatim sur la
France compte tenu de l'homonymie entre les noms d'arrondissements et des noms 
de ville,
et surtout de l'usage français qui combine les niveaux département et ville 
dans la
manière de désigner un endroit.

vincent

[1] : http://lists.openstreetmap.org/pipermail/talk-fr/2013-February/054457.html

Laposte.net, messager officiel du Rallye des Gazelles en 2013 ! Pour suivre le 
Rallye Aïcha des Gazelles et soutenir les participantes, cliquez sur 
www.laposte.net/thematique/rallye-des-gazelles

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Pieren
2013/3/18 Vincent de Chateau-Thierry v...@laposte.net:
 Ca vaut le coup d'un rapport de bug à mon avis en indiquant les liens
 ci-dessus...
 D'accord avec ça. C'est (indirectement) ce qu'on évoquait en février au 
 sujet, déjà, des
 arrondissements [1]. Ce niveau admin (niveau 7) devrait être occulté par 
 Nominatim sur la
 France compte tenu de l'homonymie entre les noms d'arrondissements et des 
 noms de ville,

C'est l'homonymie qui est une erreur. Parce que lorsque quelqu'un lit
ou écrit Caen, tout le monde comprend Caen : la ville. Tout le
monde sauf les quelques-uns qui ont taggué les arrondissements dans
OSM... Notez que ce problème d'homonymie a été résolu aux USA en
ajoutant County là où il fallait et personne n'en est mort.
Bien du courage pour expliquer à Brian Quinion pourquoi la France
ferait exception dans Nominatim.

Pieren

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Philippe Verdy
Le 18 mars 2013 13:53, Vincent de Chateau-Thierry v...@laposte.net a écrit :
 D'accord avec ça. C'est (indirectement) ce qu'on évoquait en février au 
 sujet, déjà, des
 arrondissements [1]. Ce niveau admin (niveau 7) devrait être occulté par 
 Nominatim sur la
 France compte tenu de l'homonymie entre les noms d'arrondissements et des 
 noms de ville,
 et surtout de l'usage français qui combine les niveaux département et ville 
 dans la
 manière de désigner un endroit.

Ce n'est pas spécifique à la France, mais c'est le cas dans de
nombreux pays au niveau 7 (par exemple pour les arrondissements de
Belgique, les districts en Suisse, dans certains endroits pour les
comarques en Espagne, pour les comtés aux USA (qui portent le nom
d'une ville) Bien des subdivisions adminsitratives sont nommées de
façon homonymes avec leur chef-lieu ou capitale car le toponyme
traditionnel de région n'est pas utilisé et aucun autre nom n'a été
inventé... Selon les pays, l'unicité des noms de
villes/municipalités/communes n'est garanti officiellement qu'à un
certain niveau (en Espagne c'est au niveau 6, celui des provinces,
comme en France au niveau 6 pour le niveau département).

Maintenant Nominatim n'est pas fait QUE pour chercher des noms de
villes. Aussi le terme occulter est mal venu, il n'y a pas de raison
de la cacher, juste de prendre en compte leur sélectivité en fonction
de l'admin_level.

Ici on a un problème car Nominatim voit d'un côté :
- rue, quartier, ville,...
et de 'lautre
- rue, ville, arrondissement...

Et il est évident que la sélectivité du premier cas est supérieure
(rue, niveau 10, niveau 8 ; contre rue, niveau 8, niveau 7 moins
pertinent).

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Francescu GAROBY
Je comprends bien le problème de l'homonymie, mais il y a tout de même une
différence entre Caen et Caen : l'un est en admin_level=8 (la commune),
l'autre en admin_level=7 (l'arrondissement). Et ça, ça devrait suffire à
différencier les 2 relations et comprendre leur hiérarchie (l'une dans
l'autre).
Du coup, mettre en premier des rues qui sont dans l'arrondissement de Caen,
avant celle qui se trouve dans la commune de Caen (et donc aussi dans
l'arrondissement éponyme) me semble un bug plutôt facile à corriger, non ?

Francescu


Le 18 mars 2013 14:34, Pieren pier...@gmail.com a écrit :

 2013/3/18 Vincent de Chateau-Thierry v...@laposte.net:
  Ca vaut le coup d'un rapport de bug à mon avis en indiquant les liens
  ci-dessus...
  D'accord avec ça. C'est (indirectement) ce qu'on évoquait en février au
 sujet, déjà, des
  arrondissements [1]. Ce niveau admin (niveau 7) devrait être occulté par
 Nominatim sur la
  France compte tenu de l'homonymie entre les noms d'arrondissements et
 des noms de ville,

 C'est l'homonymie qui est une erreur. Parce que lorsque quelqu'un lit
 ou écrit Caen, tout le monde comprend Caen : la ville. Tout le
 monde sauf les quelques-uns qui ont taggué les arrondissements dans
 OSM... Notez que ce problème d'homonymie a été résolu aux USA en
 ajoutant County là où il fallait et personne n'en est mort.
 Bien du courage pour expliquer à Brian Quinion pourquoi la France
 ferait exception dans Nominatim.

 Pieren

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




-- 
Cordialement,
Francescu GAROBY
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Philippe Verdy
Le 18 mars 2013 14:34, Pieren pier...@gmail.com a écrit :
 Bien du courage pour expliquer à Brian Quinion pourquoi la France
 ferait exception dans Nominatim.

Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon
de calculer la sélectivité (puisqu'il ne tient pas compte de
l'admin_level). Pas la peine de surcharger les noms pour autant.

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Francescu GAROBY
J'ouvrirai un bug ce soir, en expliquant tout ça (merci cquest pour les
liens vers les détails de nominatim : je ne connaissais pas et c'est bien
pratique).

Francescu


Le 18 mars 2013 14:38, Philippe Verdy verd...@wanadoo.fr a écrit :

 Le 18 mars 2013 14:34, Pieren pier...@gmail.com a écrit :
  Bien du courage pour expliquer à Brian Quinion pourquoi la France
  ferait exception dans Nominatim.

 Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon
 de calculer la sélectivité (puisqu'il ne tient pas compte de
 l'admin_level). Pas la peine de surcharger les noms pour autant.

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




-- 
Cordialement,
Francescu GAROBY
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Christian Quest
Tu y a facilement accès via http://nominatim.openstreetmap.org/


Le 18 mars 2013 14:41, Francescu GAROBY windu...@gmail.com a écrit :
 J'ouvrirai un bug ce soir, en expliquant tout ça (merci cquest pour les
 liens vers les détails de nominatim : je ne connaissais pas et c'est bien
 pratique).

 Francescu


-- 
Christian Quest - OpenStreetMap France
Synthèse du Week-end SOTM-FR à Lyon : http://openstreetmap.fr/synthese-sotmfr

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Philippe Verdy
Le 18 mars 2013 14:37, Francescu GAROBY windu...@gmail.com a écrit :
 Je comprends bien le problème de l'homonymie, mais il y a tout de même une
 différence entre Caen et Caen : l'un est en admin_level=8 (la commune),
 l'autre en admin_level=7 (l'arrondissement). Et ça, ça devrait suffire à
 différencier les 2 relations et comprendre leur hiérarchie (l'une dans
 l'autre).
 Du coup, mettre en premier des rues qui sont dans l'arrondissement de Caen,
 avant celle qui se trouve dans la commune de Caen (et donc aussi dans
 l'arrondissement éponyme) me semble un bug plutôt facile à corriger, non ?

Je suis du même avis : quand on recherche quelquechose, la pertinence
doit prendre en compte dans la chaîne de recherche ce qui est les plus
pertinent, c'est à dire le plus local. Même s'il y a des homonymies
(et elles sont nombreuses étant donné que Nominatim est une base de
données mondiale).

Changer localement un nom pour faire joli dans les résultats de
Nominatim ne changera rien à l'ordre de tri des résultats (car même si
on a renommé en admin_level=7 Caen en Arrondissement de Caen, cela
restera retourné malgré tout dans la recherche de nom de rue, Caen
(Nominatim fait une recherche globale des mots et n'a aucune idée d'où
couper, me^me si on a mis une virgule dans la chaîne de recherche,
d'autant plus qu'on peut rechercher sans mettre de majuscules, ni
d'accents ni aucune autre ponctuation, et que les résultats
pertinents doivent pourtant être classés (il n'y a pas de virgule
par exemple dans la base OSM qui stocke des noms séparés).

Nominatim utilise ausi d'autres critères pour la pertinence : pour
classer les villes il se base sur leur classification (city, town,
village,...) et si des données sont disponibles sur les chiffres de
population.

Actuellement le fait qu'il ait affiché les 3 résultats n'est pas une
anomalie en elle-même, c'est juste un problème de tri de la liste
retournée par pertinence (car Nominatim n'affiche pas toujours en une
seule requête tous les résultats possibles mais en retourne
quelques-uns selon leur degré de pertinence calculé, un degré de
pertinence qu'il affiche d'ailleurs dans ses résultats et tient compte
de divers tags, en donnant ensuite la possibilité à l'utilisateur de
chercher d'autres résultats moins pertinents).

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Pieren
2013/3/18 Philippe Verdy verd...@wanadoo.fr:

 Nominatim utilise ausi d'autres critères pour la pertinence : pour
 classer les villes il se base sur leur classification (city, town,
 village,...) et si des données sont disponibles sur les chiffres de
 population.

Je cherche justement les détails sur l'algorythme de recherche. Tu as
un lien à passer ?

Pieren

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Francescu GAROBY
Y a un ersatz d'explications ici :
http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview

Francescu


Le 18 mars 2013 15:31, Pieren pier...@gmail.com a écrit :

 2013/3/18 Philippe Verdy verd...@wanadoo.fr:

  Nominatim utilise ausi d'autres critères pour la pertinence : pour
  classer les villes il se base sur leur classification (city, town,
  village,...) et si des données sont disponibles sur les chiffres de
  population.

 Je cherche justement les détails sur l'algorythme de recherche. Tu as
 un lien à passer ?

 Pieren

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




-- 
Cordialement,
Francescu GAROBY
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Francescu GAROBY
Et le code est là : https://github.com/twain47/Nominatim
(désolé pour le double-mail : je me suis pris les moufles dans le
clavier...)

Francescu


Le 18 mars 2013 15:34, Francescu GAROBY windu...@gmail.com a écrit :

 Y a un ersatz d'explications ici :
 http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview

 Francescu


 Le 18 mars 2013 15:31, Pieren pier...@gmail.com a écrit :

 2013/3/18 Philippe Verdy verd...@wanadoo.fr:

  Nominatim utilise ausi d'autres critères pour la pertinence : pour
  classer les villes il se base sur leur classification (city, town,
  village,...) et si des données sont disponibles sur les chiffres de
  population.

 Je cherche justement les détails sur l'algorythme de recherche. Tu as
 un lien à passer ?

 Pieren

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




 --
 Cordialement,
 Francescu GAROBY




-- 
Cordialement,
Francescu GAROBY
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Philippe Verdy
Hormi regarder les sources... Mais une partie est documentée, le reste
a été décrit par des discussions passées mais c'est un algo en
évolution perpétuelle.

Le 18 mars 2013 15:31, Pieren pier...@gmail.com a écrit :
 2013/3/18 Philippe Verdy verd...@wanadoo.fr:

 Nominatim utilise ausi d'autres critères pour la pertinence : pour
 classer les villes il se base sur leur classification (city, town,
 village,...) et si des données sont disponibles sur les chiffres de
 population.

 Je cherche justement les détails sur l'algorythme de recherche. Tu as
 un lien à passer ?

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Pieren
2013/3/18 Francescu GAROBY windu...@gmail.com:
 Y a un ersatz d'explications ici :
 http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview

Vi, je connais. C'est une doc à la verdy_p:

 Search Algorithm
 TODO

En creusant un peu, je trouve les requêtes ici mais le code est imbuvable:
https://github.com/twain47/Nominatim/blob/master/website/search.php

Je vais essayer de m'y plonger sans me noyer... On voit bien deux
order by importance desc.
D'un autre côté, les notes de la version 2 disent search logic in
java (http://wiki.openstreetmap.org/wiki/Nominatim/Version2).
Comprenne qui pourra.

Pieren

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence

2013-03-18 Par sujet Philippe Verdy
2013/3/18 Pieren pier...@gmail.com:
 2013/3/18 Francescu GAROBY windu...@gmail.com:
 Y a un ersatz d'explications ici :
 http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview

 Vi, je connais. C'est une doc à la verdy_p:
 Search Algorithm
 TODO

Je n'y suis pour tien du tout !

 En creusant un peu, je trouve les requêtes ici mais le code est imbuvable:
 https://github.com/twain47/Nominatim/blob/master/website/search.php

 Je vais essayer de m'y plonger sans me noyer... On voit bien deux
 order by importance desc.
 D'un autre côté, les notes de la version 2 disent search logic in
 java (http://wiki.openstreetmap.org/wiki/Nominatim/Version2).
 Comprenne qui pourra.

Effectivement c'est imbuvable, mais avant de se demander comment il
fonctionne il faut savoir comment le code d'importation de ses tables
Gazetteer mappe les tags OSM en features Gazetteer. Je ne vois rien
dans ce code qui semble indiquer qu'il gère les quartiers de villes ;
les arrondissements français en revanche devraient être traités comme
les place=county aux USA, c'est à priori le même admin_level=7.

Mais dans ce paquet infâme et illisible d'expressions régulières
(surtout destiné à gérer les règles orthographiques de la toponymie et
les hiérarchies administratives des pays anglophones, avec des
exceptions incluses pour les germanophones et des hacks avoués pour
l'Etat de New York), qui sait ce que cela fait en France, même si on
fait une recherche Nominatim en anglais (je n'ai pas testé si les
résultats sont différents, à priori cela ne devrait pas l'être au
niveau des sélections et tris de résultats) !

Assez souvent, pour le guider il faut ajouter des tags d'annotation
lui permettant de classer certains éléments correctement.

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr