Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Je finis en ce moment l'ajout du tag 'wikipedia' sur les arrondissements qui ne l'avaient pas. J'en ai compté à peu près 200. Pour les cantons, la requête overpass ci-dessous me dit qu'il y en a près de 2250 à traiter ! Si quelqu'un veut écrire une moulinette capable d'ajouter le tag 'wikipedia' automatiquement, qu'il ne se gène pas pour le faire ! (J'ai d'ailleurs remarqué que quelques cantons n'ont pas de 'ref:INSEE', je vais corriger ça de suite). osm-script query type=relation has-kv k=boundary v=political/ has-kv k=political_division v=canton/ has-kv k=ref:INSEE regv=./ has-kv k=wikipedia modv=not regv=./ /query print mode=meta/ /osm-script Francescu Le 21 mars 2013 20:20, Philippe Verdy verd...@wanadoo.fr a écrit : Sur les arrondissements, je crois que les liens y sont tous déjà; pour les cantons, comme beaucoup ont été importés massivement il y a quelques mois par un bot (qui cherchait les cantons définis uniquement par des listes de communes entières, et dont les frontières étaient déjà entièrement tracées), il doit manquer certainement des tas de liens sur ceux-là sui n'ont pas été revus depuis. Méfiance tout de même car j'ai vu un cas (je ne sais plus où, désolé je n'ai pas noté car je l'ai corrigé au passage) où le bot avait importé un canton en oubliant d'exclure une enclave d'un autre canton, provenant d'une commune hors du canton mais dont les frontières étaient alors incomplètes et ont été ignorées. En apparence cela fermait le canton importé était bien fermé, mais il était trop grand en oubliant d'exclure cette enclave avec des membres inner (une enclave dont les frontières communales étaient pourtant déjà tracées, même si sa commune n'était pas complète ; noter que la commune enclavante avait aussi oublié d'exclure cette enclave avec des membres inner sans sa propre relation). Le 20 mars 2013 22:41, Francescu GAROBY windu...@gmail.com a écrit : Pour faire le lien avec le projet du mois, ça vaut le coup d'aller mettre les tags wikipedia sur les cantons et arrondissements, selon vous ? -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Sur les arrondissements, je crois que les liens y sont tous déjà; pour les cantons, comme beaucoup ont été importés massivement il y a quelques mois par un bot (qui cherchait les cantons définis uniquement par des listes de communes entières, et dont les frontières étaient déjà entièrement tracées), il doit manquer certainement des tas de liens sur ceux-là sui n'ont pas été revus depuis. Méfiance tout de même car j'ai vu un cas (je ne sais plus où, désolé je n'ai pas noté car je l'ai corrigé au passage) où le bot avait importé un canton en oubliant d'exclure une enclave d'un autre canton, provenant d'une commune hors du canton mais dont les frontières étaient alors incomplètes et ont été ignorées. En apparence cela fermait le canton importé était bien fermé, mais il était trop grand en oubliant d'exclure cette enclave avec des membres inner (une enclave dont les frontières communales étaient pourtant déjà tracées, même si sa commune n'était pas complète ; noter que la commune enclavante avait aussi oublié d'exclure cette enclave avec des membres inner sans sa propre relation). Le 20 mars 2013 22:41, Francescu GAROBY windu...@gmail.com a écrit : Pour faire le lien avec le projet du mois, ça vaut le coup d'aller mettre les tags wikipedia sur les cantons et arrondissements, selon vous ? ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Pieren pier...@gmail.com wrote: C'est quand même incroyable de devoir dépendre d'un projet externe (wikipedia) qui lui n'hésite pas à nommer les choses par leur nom (wikipedia=fr:Arrondissement de Caen) pour compenser les tergiversations de quelques contributeurs OSM. Bon hier soir j'ai expérimenté et j'ai osé nommé l'Arrondissement de Cognac en Arrondissement de Cognac (au lieu de Cognac) et bien voilà Nominatim ne s'embrouille plus et la recherche Cognac me retourne dsormais la ville en premier, suivi de la gare (nommé Cognac seuelement, faudra-t'il aussi la nommer Gare de Cognac ?) puis la hameau Cognac qui porte bien son nom. -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Le 20 mars 2013 08:04, Pierre-Alain Dorange pdora...@mac.com a écrit : Bon hier soir j'ai expérimenté et j'ai osé nommé l'Arrondissement de Cognac en Arrondissement de Cognac (au lieu de Cognac) et bien voilà Nominatim ne s'embrouille plus et la recherche Cognac me retourne dsormais la ville en premier, suivi de la gare (nommé Cognac seuelement, faudra-t'il aussi la nommer Gare de Cognac ?) puis la hameau Cognac qui porte bien son nom. Ca me semble assez logique d'appeler un chat un chat et donc un arrondissement un arrondissement. Toutefois, conserver un libellé simple sans la mention arrondissement peut aussi être utile (exemple pour une carte des sous-préfectures et de leur arrondissement où on ne va pas répéter Arrondissement de sans arrêt). Pour les gares (ou autre) ça mérite aussi réflexion... et on a un problème similaire. Lors de telle utilisation Gare de Machin sera utile (exemple avec Nominatim), mais pour une autre réutilisation Machin sera nécessaire. Exemple sur un rendu de carte où il y a une icône qui symbolise la gare, donc où il est inutile de le répéter dans le texte qui n'a jamais assez de place pour être placé. Dans tout les cas, il faudrait harmoniser et ne pas perdre de vue ce qui est fait hors hexagone. Entre name, official_name, short_name on va bien trouver de quoi conserver les différentes variantes de nom qui ont chacune une utilité et qu'on ne peut pas toujours déterminer automatiquement. -- Christian Quest - OpenStreetMap France Synthèse du Week-end SOTM-FR à Lyon : http://openstreetmap.fr/synthese-sotmfr ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Le 20/03/2013 08:04, Pierre-Alain Dorange a écrit : Pieren pier...@gmail.com wrote: C'est quand même incroyable de devoir dépendre d'un projet externe (wikipedia) qui lui n'hésite pas à nommer les choses par leur nom (wikipedia=fr:Arrondissement de Caen) pour compenser les tergiversations de quelques contributeurs OSM. Bon hier soir j'ai expérimenté et j'ai osé nommé l'Arrondissement de Cognac en Arrondissement de Cognac (au lieu de Cognac) et bien voilà Nominatim ne s'embrouille plus et la recherche Cognac me retourne dsormais la ville en premier, suivi de la gare (nommé Cognac seuelement, faudra-t'il aussi la nommer Gare de Cognac ?) puis la hameau Cognac qui porte bien son nom. Pourquoi faut-il ajouter gare dans le nom alors qu'il y a railway=station C'est comme porter une ceinture et des bretelles. Si l’algorithme ne s'y retrouve pas c'est l’algorithme qu'il faut changer. -- FrViPofm ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Je rejoins Vincent : les arrondissements comme les gares ne devraient pas se nommer arrondissement de .../gare de ... ou alors changeons aussi les communes en commune de ... ! Francescu Le 20 mars 2013 08:54, Vincent Pottier vpott...@gmail.com a écrit : Le 20/03/2013 08:04, Pierre-Alain Dorange a écrit : Pieren pier...@gmail.com wrote: C'est quand même incroyable de devoir dépendre d'un projet externe (wikipedia) qui lui n'hésite pas à nommer les choses par leur nom (wikipedia=fr:Arrondissement de Caen) pour compenser les tergiversations de quelques contributeurs OSM. Bon hier soir j'ai expérimenté et j'ai osé nommé l'Arrondissement de Cognac en Arrondissement de Cognac (au lieu de Cognac) et bien voilà Nominatim ne s'embrouille plus et la recherche Cognac me retourne dsormais la ville en premier, suivi de la gare (nommé Cognac seuelement, faudra-t'il aussi la nommer Gare de Cognac ?) puis la hameau Cognac qui porte bien son nom. Pourquoi faut-il ajouter gare dans le nom alors qu'il y a railway=station C'est comme porter une ceinture et des bretelles. Si l’algorithme ne s'y retrouve pas c'est l’algorithme qu'il faut changer. -- FrViPofm __**_ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.**org/listinfo/talk-frhttp://lists.openstreetmap.org/listinfo/talk-fr -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Le 20 mars 2013 08:54, Vincent Pottier vpott...@gmail.com a écrit : Pourquoi faut-il ajouter gare dans le nom alors qu'il y a railway=station C'est comme porter une ceinture et des bretelles. Si l’algorithme ne s'y retrouve pas c'est l’algorithme qu'il faut changer. Il n'est pas toujours possible de calculer ces noms automatiquement et surtout sans faire d'erreur. Gare de Gare du Gare d' Gérer correctement les H aspirés ou muets est une galère... Le diable se cache dans les détails... et les exceptions ;) -- Christian Quest - OpenStreetMap France Synthèse du Week-end SOTM-FR à Lyon : http://openstreetmap.fr/synthese-sotmfr ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Le 20 mars 2013 09:03, Francescu GAROBY windu...@gmail.com a écrit : Je rejoins Vincent : les arrondissements comme les gares ne devraient pas se nommer arrondissement de .../gare de ... ou alors changeons aussi les communes en commune de ... ! Sans oulier aussi les départements qu portent aussi le nom des fleuves... Ce renommage qui ne sert qu'à régler un problème de tri des résutlats sur Nominatim (lequel de toute façon fait parfaitement la différence dans ses résultats en les affichant bel et bien différemment même si la requête est ambiguë et fait apparaitre plusieurs possibilités,) c'est vraiement taguer pour le rendu. Pas besoin de Arrrondissement de, pas plus que Département de, Commune de, Région de, Canton de ... même si Nominatim parfois calcule mal sa pertinence (parce qu'il utilise des règles empiriques assez farfelues pour son classement, ce qui pourtant n'entraine aucune confusion). Wikipédia est obligé de mettre une précision dans son titre car il n'a pas moyen de faire autrement, chaque titre devant être unique, sinon il crée une page d'homonymie et oblige l'utilisateur à aller d'abord sur cette page pour choisir un des liens proposés.. Si un utilisateur fait une recherche sur Nominatim et obtient plusieurs résulats, et que ces résultats sont justes, mais seulement pas triés de la façon à laquelle il s'atend simplement parce qu'il ne sait pas lire ces résultats et voudrait absolument que le seul résultat qui l'intéresse doit (pour lui seulement) être le premier de la liste, c'est l'utilisateur qui a un problème... de paresse surtout (car il n'a surtout pas envie de lire les libellés affichés ni même de regarder, s'il a un doute, sur le lien détails ! Il n'est pas anormal que Nominatim permette de rechercher plein de choses : des villes, des arronidissements, des gares, des stations de bus ou métro. Nominatim les diffférencie sans problème même s'il affiche plusieurs résultats. Et puis Nominatim n'est pas le seul concerné, c'est un rendu particulier. Mêmme l'insee ne met pas Arrondissement de dans sa base. ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
T't't'… Ce n'est toujours pas parce que l'algorithme n'est pas parfait (aujourd'hui) qu'il faut modifier toute la base en conséquence. Tagguer pour le rendu, on ne s'en rend plus toujours compte quand on y est jusqu'au nez (dans le rendu) ? JB. Le 20.03.2013 09:11, Christian Quest a écrit : Le 20 mars 2013 08:54, Vincent Pottier vpott...@gmail.com a écrit : Pourquoi faut-il ajouter gare dans le nom alors qu'il y a railway=station C'est comme porter une ceinture et des bretelles. Si l'algorithme ne s'y retrouve pas c'est l'algorithme qu'il faut changer. Il n'est pas toujours possible de calculer ces noms automatiquement et surtout sans faire d'erreur. Gare de Gare du Gare d' Gérer correctement les H aspirés ou muets est une galère... Le diable se cache dans les détails... et les exceptions ;) ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Le 20/03/2013 09:11, Christian Quest a écrit : Le 20 mars 2013 08:54, Vincent Pottier vpott...@gmail.com a écrit : Pourquoi faut-il ajouter gare dans le nom alors qu'il y a railway=station C'est comme porter une ceinture et des bretelles. Si l’algorithme ne s'y retrouve pas c'est l’algorithme qu'il faut changer. Il n'est pas toujours possible de calculer ces noms automatiquement et surtout sans faire d'erreur. Gare de Gare du Gare d' Gérer correctement les H aspirés ou muets est une galère... Le diable se cache dans les détails... et les exceptions ;) Alors pour chasser le diable, je préférerais un alt_name=Gare d'Ambialet Je peux en causer à un exorciste... J'en ai un à la maison :-) http://wiki.openstreetmap.org/wiki/Names#Name_is_the_name_only N.B. La question se pose aussi pour d'autres objets... Je tagge les églises en name=Église Saint-Glinglin|Collégiale Sainte-Gudule|Abbatiale Saint Propter... et ai un peu standardisé cette forme (en évitant la redondance église abbatiale). Église, Collégiale, Abbatiale, Basilique, Cathédrale sont des titres comme Docteur, Professeur donc font tout de même partie du nom (En droit canonique chapelle est un titre un peu différent, mais bon... on reste simple). On peut considérer les Collège École primaire... un peu de la même façon s'il sont apposés au nom auxquels ces établissements sont dédicacés : Collège Paul-Émile Victor Mais Église de Truc-les-Nemours, ce n'est pas un name... Ni Mairie de Truc-les-Nemours, ni Stade de Truc-les-Nemours, ni Gare de Truc-les-Nemours, ni Collège de Truc-les-Nemours. Et encore moins les formes toutes sèches Église, Mairie, Stade, Gare, Collège... Pas bien ! -- FrViPofm ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
En attendant, on pouvait chercher tous les arrondissements français par leur nom simple, et c'était bien dans la liste des résultats retournés par Nominatim. Mais si maintenant on recherche Cognac, on ne troue plus QUE la ville et pas l'arrondissement, et c'est... mal. Le fait que la liste retournée par Nominatim quand on cherche juste Cognac contienne AUSSI l'arrondissement n'est PAS une anomalie de Nominatim. On peut uniquement jouer sur le critère de pertinence pour que la ville soit listée avant l'arrondissement dans cette liste, et les moyens pour ça existent déjà. Mais il n'y a strictement aucune raison de supprimer l'arrondissement de cette liste par le renommage. Le critère de pertinence est forcément subjectif et dépendant de ce que recherche l'utilisateur, ce n'est pas à nous de décider que la ville doit y figurer mais pas l'arrondissement. Mais on peut faire en sorte que la ville apparaisse en premier sans utiliser ce renommage. Bref il faut revenir à Cognac pour le name=*. Les autres considérations comme le fait de composer l'expression arrondissement de Cognac à partir des infos déjà corrects fournies sont du traitement linguistique, et cela n'a rien à voir avec ce que doit contenir et retourner une base de données lors des recherches, car elle fournit déjà assez d'infos. On pourrait éventuellement codifier et taguer les traitements linguistiques possibles, mais si on veut on peut toujours ajouter un autre tag pour la forme longue. Mais même si on a mis un tag supplémentaire long_name=Arrondissement de Cognac, il restera encore le problème de la capitale initiale (malvenue pour l'utilisation dans une phrase car le mot Arrondissement n'est pas un nom propre) et du fait qu'il faudra éventuellement contracter un article placé avant avec une apostrophe (bref cela demanderait encore un traitement linguistique, spécifique au français, avec sa propre codification de toute façon si on devait la renseigner aussi dans la base). ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Vincent Pottier vpott...@gmail.com wrote: Pourquoi faut-il ajouter gare dans le nom alors qu'il y a railway=station C'est comme porter une ceinture et des bretelles. Si l'algorithme ne s'y retrouve pas c'est l'algorithme qu'il faut changer. Je pose juste la question, sur ce point c'est pas vraiment génant, puisque même en l'état actuel si la recherche retourne la gare aussi elle est pas en premier et il est indiqué Gare dans c'est OK. -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Philippe Verdy verd...@wanadoo.fr wrote: Sans oulier aussi les départements qu portent aussi le nom des fleuves... Ce renommage qui ne sert qu'à régler un problème de tri des résutlats sur Nominatim (lequel de toute façon fait parfaitement la différence dans ses résultats en les affichant bel et bien différemment même si la requête est ambiguë et fait apparaitre plusieurs possibilités,) c'est vraiement taguer pour le rendu. [...] Je me fais aussi cette remarque c'est un peu comem taguer pour le rendu en effet, mais c'est aussi un peu plus complexe que cela. Ta remarque département/fleuve est juste mais pas du même ordre. personne ne cherchera la rue truc sur le fleuve machin. Par contre la rue truc dans le département machin oui. Donc a priori pas de réel problème de recherche dans ce cas. Par contre pour les communes et arrondissements c'est plus délicat car il y a le résultat de la recherche strict du nom (ex. Cognac ou Caen) ou personne (pas même un algorythme) ne pourra lever totalement l'ambiguité et deviner ce que veut réellement l'utilisateur (même si peu font des recherches d'arrondissement sans le préciser). Mais là ou ça se complique c'est dans l'exemple initial ou on associe au nom de base une rue (par exemple) et là on a plusieurs candidats. Il y a là une amélioration possible de Nominatim : pour mettre en avant la ville avant l'arrondissement à priori (et sans artifices comme ajouter un lien wikipédia). Mais dans un cadre plus général on peut imaginer une ville et un hameau avec chacun le même nom de rue et alors qui mettre en premier ? Ou dans un cadre encore plus général 2 admin_level avec le même nom de rue. Comment déterminer celui le plus probable... C'est un problème complexe et pas totalement soluble par algorythme a mon avis. Si wikipédia a pris la solution de nommer explicitement la chose c'est bien pour une raison, et l'unicité ne suffit pas car les pages d'homonymie existe pour la plupart de ces cas afin justement de guider. -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Le 20 mars 2013 20:26, Pierre-Alain Dorange pdora...@mac.com a écrit : Ta remarque département/fleuve est juste mais pas du même ordre. personne ne cherchera la rue truc sur le fleuve machin. Par contre la rue truc dans le département machin oui. Donc a priori pas de réel problème de recherche dans ce cas. Par contre pour les communes et arrondissements c'est plus délicat car il y a le résultat de la recherche strict du nom (ex. Cognac ou Caen) ou personne (pas même un algorythme) ne pourra lever totalement l'ambiguité et deviner ce que veut réellement l'utilisateur (même si peu font des recherches d'arrondissement sans le préciser). Pourtant Nominatim affiche les deux résultats de façon différente (même s'il n'affiche pas les valeurs d'admin_level, il les interprète en affichant un type:place:country ou type:place:city car les deux relations sont importées dans des tables de features avec des attributs bel et bien différents, et Nominatim les hiérarchise aussi (pour faciliter les recherches par inclusion d'une région dans une autre, et pour les afficher **toutes** dans l'ordre, de la plus petite à la plus grande. Je ne vois aucune anomalie dans les résultats de Nominatim, même si l'affichage des résultats (sur le site Nominatim, pas dans sa base) peut être amélioré (et le tri des résulats dans une liste fait partie du travail du site, beaucoup plus que de sa base, ce tri se faisant alors sur un critère de pertinence qui reste totalement empirique, mais qui n'élimine **aucun** résultat. Bref il faut savoir lire ces résultats, même si l'affichage du site peut être amélioré (il le fait déjà par exemple pour les gares en affichant une icône distinctives à côté du nom, il différencie les noeuds et les surfaces aussi avec une icône différente, et il fournit plein d'attributs supplémentaires dans les détails, y compris un lien Wikipédia qui peut donner des explications et lever l'ambiguïté qui reste). Donc renommer des objets pour en faire disparaître certains dans les résultats de Nominatim est une mauvaise idée. Je persiste que c'est idiot de faire ça dans la base OSM : les arrondissements français ne sont **pas** des comtés comme aux USA, ce ne sont pas des collectivités locales. le mot arrondissement reste un terme générique, et ne fait pas partie du nom. Les arrondissements ont nommés par leur nom de commune chef-lieu, ou parfois de deux communes (p.ex. Fougères-Vitré récemment), ou d'une commune et d'une précision qui les distingue quand leur chef-lieu est le même (p.ex. Strasbourg-Ville, Strasbourg-Campagne), et cela suffit pour toutes les recherches. Et c'est la même chose aussi en Belgique. Qu'est-ce qui vous déplait, que le nom d'arrondissement s'affiche (alors qu'on ne le met typiquement pas dans une adresse postale) ? Nominatim n'est pas fait pour gérer juste les adresses postales, et ces ajouts d'informations sont aussi utiles pendant les recherches en tant que précision visible permettant de choisir entre les résultats multiples affichés ou confirmer qu'on a bien géolocalisé le bon endroit. Le seul fait qu'il y ait plusieurs résultats homonymes affichés (mais avec des précisions supplémentaires pour faire la différence) montre que ces affichages sont utiles pour lever les ambiguïtés (c'est aussi utile que sur Wikipédia quand on cherche un mot et qu'on tombe sur une age d'homonymie pour lever l'ambiguïté en lasisant le lecteur choisir ce qu'il veut consulter). ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Pour faire le lien avec le projet du mois, ça vaut le coup d'aller mettre les tags wikipedia sur les cantons et arrondissements, selon vous ? Francescu Le 20 mars 2013 20:47, Philippe Verdy verd...@wanadoo.fr a écrit : Le 20 mars 2013 20:26, Pierre-Alain Dorange pdora...@mac.com a écrit : Ta remarque département/fleuve est juste mais pas du même ordre. personne ne cherchera la rue truc sur le fleuve machin. Par contre la rue truc dans le département machin oui. Donc a priori pas de réel problème de recherche dans ce cas. Par contre pour les communes et arrondissements c'est plus délicat car il y a le résultat de la recherche strict du nom (ex. Cognac ou Caen) ou personne (pas même un algorythme) ne pourra lever totalement l'ambiguité et deviner ce que veut réellement l'utilisateur (même si peu font des recherches d'arrondissement sans le préciser). Pourtant Nominatim affiche les deux résultats de façon différente (même s'il n'affiche pas les valeurs d'admin_level, il les interprète en affichant un type:place:country ou type:place:city car les deux relations sont importées dans des tables de features avec des attributs bel et bien différents, et Nominatim les hiérarchise aussi (pour faciliter les recherches par inclusion d'une région dans une autre, et pour les afficher **toutes** dans l'ordre, de la plus petite à la plus grande. Je ne vois aucune anomalie dans les résultats de Nominatim, même si l'affichage des résultats (sur le site Nominatim, pas dans sa base) peut être amélioré (et le tri des résulats dans une liste fait partie du travail du site, beaucoup plus que de sa base, ce tri se faisant alors sur un critère de pertinence qui reste totalement empirique, mais qui n'élimine **aucun** résultat. Bref il faut savoir lire ces résultats, même si l'affichage du site peut être amélioré (il le fait déjà par exemple pour les gares en affichant une icône distinctives à côté du nom, il différencie les noeuds et les surfaces aussi avec une icône différente, et il fournit plein d'attributs supplémentaires dans les détails, y compris un lien Wikipédia qui peut donner des explications et lever l'ambiguïté qui reste). Donc renommer des objets pour en faire disparaître certains dans les résultats de Nominatim est une mauvaise idée. Je persiste que c'est idiot de faire ça dans la base OSM : les arrondissements français ne sont **pas** des comtés comme aux USA, ce ne sont pas des collectivités locales. le mot arrondissement reste un terme générique, et ne fait pas partie du nom. Les arrondissements ont nommés par leur nom de commune chef-lieu, ou parfois de deux communes (p.ex. Fougères-Vitré récemment), ou d'une commune et d'une précision qui les distingue quand leur chef-lieu est le même (p.ex. Strasbourg-Ville, Strasbourg-Campagne), et cela suffit pour toutes les recherches. Et c'est la même chose aussi en Belgique. Qu'est-ce qui vous déplait, que le nom d'arrondissement s'affiche (alors qu'on ne le met typiquement pas dans une adresse postale) ? Nominatim n'est pas fait pour gérer juste les adresses postales, et ces ajouts d'informations sont aussi utiles pendant les recherches en tant que précision visible permettant de choisir entre les résultats multiples affichés ou confirmer qu'on a bien géolocalisé le bon endroit. Le seul fait qu'il y ait plusieurs résultats homonymes affichés (mais avec des précisions supplémentaires pour faire la différence) montre que ces affichages sont utiles pour lever les ambiguïtés (c'est aussi utile que sur Wikipédia quand on cherche un mot et qu'on tombe sur une age d'homonymie pour lever l'ambiguïté en lasisant le lecteur choisir ce qu'il veut consulter). ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Philippe Verdy verd...@wanadoo.fr wrote: [...] Qu'est-ce qui vous déplait, que le nom d'arrondissement s'affiche (alors qu'on ne le met typiquement pas dans une adresse postale) ? Pour faire court (mais je suis d'accord avec ce que tu dis plus haut, on tagge pas pour le rendu, ni la recherche) : Dans l'exemple que je prenais au départ (une recherche Cognac), le résultat retourné est pas explicite puisque Nominatim retourne en tête l'arrondissement, suivi de la ville sans précision. Les 2 sont identiques à l'écran (sur le site OSM et sur le site Nominatim). On arrive a comprendre la différence uniquement en consultant les détails Nominatim (voir mon autre enfilade ouverte hier pour plus de détails). Le premier étant l'arrondissement, la carte proposée pointe en pleine campagne (le centre de l'arrondissement) et on voit pas la ville de Cognac à l'écran... Certes c'est plus un problème de hiérarchisation des résultats Nominatim (je suis d'accord et je l'ai dis moi même hier) mais le résultat reste étrange. C'est tout. -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
J'ai ouvert un ticket hier soir, et ai déjà eu ma réponse (et la correction) : https://trac.openstreetmap.org/ticket/4811 Si je comprends bien, la présence du tag wikipedia a plus d'importance que la valeur du tag admin_level (qui n'est absolument pas abordé dans la réponse) ? C'est bon à savoir pour le projet du mois ;-) Francescu Le 18 mars 2013 17:35, Philippe Verdy verd...@wanadoo.fr a écrit : 2013/3/18 Pieren pier...@gmail.com: 2013/3/18 Francescu GAROBY windu...@gmail.com: Y a un ersatz d'explications ici : http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview Vi, je connais. C'est une doc à la verdy_p: Search Algorithm TODO Je n'y suis pour tien du tout ! En creusant un peu, je trouve les requêtes ici mais le code est imbuvable: https://github.com/twain47/Nominatim/blob/master/website/search.php Je vais essayer de m'y plonger sans me noyer... On voit bien deux order by importance desc. D'un autre côté, les notes de la version 2 disent search logic in java (http://wiki.openstreetmap.org/wiki/Nominatim/Version2). Comprenne qui pourra. Effectivement c'est imbuvable, mais avant de se demander comment il fonctionne il faut savoir comment le code d'importation de ses tables Gazetteer mappe les tags OSM en features Gazetteer. Je ne vois rien dans ce code qui semble indiquer qu'il gère les quartiers de villes ; les arrondissements français en revanche devraient être traités comme les place=county aux USA, c'est à priori le même admin_level=7. Mais dans ce paquet infâme et illisible d'expressions régulières (surtout destiné à gérer les règles orthographiques de la toponymie et les hiérarchies administratives des pays anglophones, avec des exceptions incluses pour les germanophones et des hacks avoués pour l'Etat de New York), qui sait ce que cela fait en France, même si on fait une recherche Nominatim en anglais (je n'ai pas testé si les résultats sont différents, à priori cela ne devrait pas l'être au niveau des sélections et tris de résultats) ! Assez souvent, pour le guider il faut ajouter des tags d'annotation lui permettant de classer certains éléments correctement. ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Une règle qui frise l'empririsme total... Je ne vois pas en quoi un lien vers un article Wikipédia est pertinent pour trouver une adresse ! Alors que l'admin_level est évidemment bien plus important. Le 19 mars 2013 08:17, Francescu GAROBY windu...@gmail.com a écrit : J'ai ouvert un ticket hier soir, et ai déjà eu ma réponse (et la correction) : https://trac.openstreetmap.org/ticket/4811 Si je comprends bien, la présence du tag wikipedia a plus d'importance que la valeur du tag admin_level (qui n'est absolument pas abordé dans la réponse) ? C'est bon à savoir pour le projet du mois ;-) Francescu Le 18 mars 2013 17:35, Philippe Verdy verd...@wanadoo.fr a écrit : 2013/3/18 Pieren pier...@gmail.com: 2013/3/18 Francescu GAROBY windu...@gmail.com: Y a un ersatz d'explications ici : http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview Vi, je connais. C'est une doc à la verdy_p: Search Algorithm TODO Je n'y suis pour tien du tout ! En creusant un peu, je trouve les requêtes ici mais le code est imbuvable: https://github.com/twain47/Nominatim/blob/master/website/search.php Je vais essayer de m'y plonger sans me noyer... On voit bien deux order by importance desc. D'un autre côté, les notes de la version 2 disent search logic in java (http://wiki.openstreetmap.org/wiki/Nominatim/Version2). Comprenne qui pourra. Effectivement c'est imbuvable, mais avant de se demander comment il fonctionne il faut savoir comment le code d'importation de ses tables Gazetteer mappe les tags OSM en features Gazetteer. Je ne vois rien dans ce code qui semble indiquer qu'il gère les quartiers de villes ; les arrondissements français en revanche devraient être traités comme les place=county aux USA, c'est à priori le même admin_level=7. Mais dans ce paquet infâme et illisible d'expressions régulières (surtout destiné à gérer les règles orthographiques de la toponymie et les hiérarchies administratives des pays anglophones, avec des exceptions incluses pour les germanophones et des hacks avoués pour l'Etat de New York), qui sait ce que cela fait en France, même si on fait une recherche Nominatim en anglais (je n'ai pas testé si les résultats sont différents, à priori cela ne devrait pas l'être au niveau des sélections et tris de résultats) ! Assez souvent, pour le guider il faut ajouter des tags d'annotation lui permettant de classer certains éléments correctement. ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Philippe Verdy verd...@wanadoo.fr wrote: Bien du courage pour expliquer à Brian Quinion pourquoi la France ferait exception dans Nominatim. Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon de calculer la sélectivité (puisqu'il ne tient pas compte de l'admin_level). Pas la peine de surcharger les noms pour autant. Je suis pas sur... Le soucis a mon sens provient vraiment de l'homonymie Caen (Ville) et Caen (Arrondissement). Nominatim n'a aucun moyen de savoir qui privilégier et même il faudrai privilégier l'arrondissement car d'admin_level plus faible donc de sens plus large. De même qui (si ça existe) il faudrait privilégier a priori une recherche sur une région plutot que sur une ville ou un quartier (qui aurait le même nom)... Je sais pas si je suis très clair. Je rencontre exactement le même problème (je viens du publier mon soucis avant le lire cette enfilade... erreur fatale). Et dans mon cas (Cognac) je ne vois pas d'autres solutions que d'aider nominatim en précisant la dénomination, et donc en ajoutant Arrondissement de Cognac à l'admin_level 7. Prenons un cas purement théorique (pour éviter de se focaliser sur un exemple) ou on aurait tout les niveaux admin_level avec le même nom (c'est con mais c'est un exemple pour pousser l'algorythme à bout). Si l'utilisateur fait un recherche sur le simple nom, que faut-t'il privilégier ? Le pays, la région, le département, la ville ou le quartier... Que cherche l'utilisateur ? Et dans le cas ou la recherche c'est nom d'une rue, xxx il est probable que cette rue existe de nombreuse fois dans le pays, que chercher vraiment l'utilisateur... le plus haut niveau (pays) ou le plus bas (quartier) ? Je suis pas sur qu'il y ait de réponse simple... -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Francescu GAROBY windu...@gmail.com wrote: J'ai ouvert un ticket hier soir, et ai déjà eu ma réponse (et la correction) : https://trac.openstreetmap.org/ticket/4811 Si je comprends bien, la présence du tag wikipedia a plus d'importance que la valeur du tag admin_level (qui n'est absolument pas abordé dans la réponse) ? C'est bon à savoir pour le projet du mois ;-) Ce qui ne résoudra rien quand on aura mis des liens wikipédia a tout les niveaux... -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Nominatim n'affiche pas les résultats de la même façon : il indique bien le type de relation (place=country, place=city...) Il se trouve que le site web a évolué entre temps et que dans la liste des résultats parmi ceux qu'on peut choisir, il ne précise plus rien (il faut consulter le détail). Nominatim lui-m^rme n'est pas en cause, mais ici c'est plutôt le site web gérant le formulaire de recherche dans la base Nominatim. Si je fais la recherche Nominatim dans JOSM, on a encore les détails nécessaires dans les listes de résultats. Si Nominatim était clair, il ne devrait pas afficher la ville ou l'arrondissement tout seul mais toujours les indiquer avec leur adresse complète (du plus fin au plus large) et dans ce cas la différence est manifeste. Nominatim n'a effectivement pas à choisir, mais il doit trier les résulats multiples selon un critère de pertinence (et dans ce cas il risque de ne pas tout afficher sur la même page s'il y a trop de résultats. Tant qu'il abrège pas ses résultats en n'indiquant QUE le nom recherché et pas dans quoi il se situe, il n'y a pas de confusion possible. Le 19 mars 2013 19:47, Pierre-Alain Dorange pdora...@mac.com a écrit : Philippe Verdy verd...@wanadoo.fr wrote: Bien du courage pour expliquer à Brian Quinion pourquoi la France ferait exception dans Nominatim. Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon de calculer la sélectivité (puisqu'il ne tient pas compte de l'admin_level). Pas la peine de surcharger les noms pour autant. Je suis pas sur... Le soucis a mon sens provient vraiment de l'homonymie Caen (Ville) et Caen (Arrondissement). Nominatim n'a aucun moyen de savoir qui privilégier et même il faudrai privilégier l'arrondissement car d'admin_level plus faible donc de sens plus large. De même qui (si ça existe) il faudrait privilégier a priori une recherche sur une région plutot que sur une ville ou un quartier (qui aurait le même nom)... Je sais pas si je suis très clair. Je rencontre exactement le même problème (je viens du publier mon soucis avant le lire cette enfilade... erreur fatale). Et dans mon cas (Cognac) je ne vois pas d'autres solutions que d'aider nominatim en précisant la dénomination, et donc en ajoutant Arrondissement de Cognac à l'admin_level 7. Prenons un cas purement théorique (pour éviter de se focaliser sur un exemple) ou on aurait tout les niveaux admin_level avec le même nom (c'est con mais c'est un exemple pour pousser l'algorythme à bout). Si l'utilisateur fait un recherche sur le simple nom, que faut-t'il privilégier ? Le pays, la région, le département, la ville ou le quartier... Que cherche l'utilisateur ? Et dans le cas ou la recherche c'est nom d'une rue, xxx il est probable que cette rue existe de nombreuse fois dans le pays, que chercher vraiment l'utilisateur... le plus haut niveau (pays) ou le plus bas (quartier) ? Je suis pas sur qu'il y ait de réponse simple... -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Non, parce que le tag Wikipedia pour l'arrondissement de Caen est wikipedia=fr:Arrondissement de Caen. Et tous les articles vers les arrondissements de France sont conçus de cette façon. Francescu Le 19 mars 2013 19:47, Pierre-Alain Dorange pdora...@mac.com a écrit : Francescu GAROBY windu...@gmail.com wrote: J'ai ouvert un ticket hier soir, et ai déjà eu ma réponse (et la correction) : https://trac.openstreetmap.org/ticket/4811 Si je comprends bien, la présence du tag wikipedia a plus d'importance que la valeur du tag admin_level (qui n'est absolument pas abordé dans la réponse) ? C'est bon à savoir pour le projet du mois ;-) Ce qui ne résoudra rien quand on aura mis des liens wikipédia a tout les niveaux... -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Oui, mais une rue (comme celle que je cherchais) qui se trouve dans la commune de Caen, se trouve forcément dans l'arrondissement de Caen, alors que les autres solutions proposées ne sont *que* dans l'arrondissement de Caen. On pourrait alors penser qu'en tapant rue Eugène Boudin, Caen, il vaudrait mieux privilégier le cas où Caen désigne commune *et*arrondissement, car il remplit plus de conditions que les autres résultats. Autre raison : on cherche plus souvent une adresse dans une commune qu'une adresse dans un arrondissement (qui connait vraiment les limites des arrondissements ?). Francescu Le 19 mars 2013 19:47, Pierre-Alain Dorange pdora...@mac.com a écrit : Philippe Verdy verd...@wanadoo.fr wrote: Bien du courage pour expliquer à Brian Quinion pourquoi la France ferait exception dans Nominatim. Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon de calculer la sélectivité (puisqu'il ne tient pas compte de l'admin_level). Pas la peine de surcharger les noms pour autant. Je suis pas sur... Le soucis a mon sens provient vraiment de l'homonymie Caen (Ville) et Caen (Arrondissement). Nominatim n'a aucun moyen de savoir qui privilégier et même il faudrai privilégier l'arrondissement car d'admin_level plus faible donc de sens plus large. De même qui (si ça existe) il faudrait privilégier a priori une recherche sur une région plutot que sur une ville ou un quartier (qui aurait le même nom)... Je sais pas si je suis très clair. Je rencontre exactement le même problème (je viens du publier mon soucis avant le lire cette enfilade... erreur fatale). Et dans mon cas (Cognac) je ne vois pas d'autres solutions que d'aider nominatim en précisant la dénomination, et donc en ajoutant Arrondissement de Cognac à l'admin_level 7. Prenons un cas purement théorique (pour éviter de se focaliser sur un exemple) ou on aurait tout les niveaux admin_level avec le même nom (c'est con mais c'est un exemple pour pousser l'algorythme à bout). Si l'utilisateur fait un recherche sur le simple nom, que faut-t'il privilégier ? Le pays, la région, le département, la ville ou le quartier... Que cherche l'utilisateur ? Et dans le cas ou la recherche c'est nom d'une rue, xxx il est probable que cette rue existe de nombreuse fois dans le pays, que chercher vraiment l'utilisateur... le plus haut niveau (pays) ou le plus bas (quartier) ? Je suis pas sur qu'il y ait de réponse simple... -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Francescu GAROBY windu...@gmail.com wrote: Non, parce que le tag Wikipedia pour l'arrondissement de Caen est wikipedia=fr:Arrondissement de Caen. Et tous les articles vers les arrondissements de France sont conçus de cette façon. Donc wikipdia a résolu ce même problème nommant l'arrondissement Caen en Arrondissement de Caen... pourquoi pas faire de même chez nous ? -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Philippe Verdy verd...@wanadoo.fr wrote: Nominatim n'affiche pas les résultats de la même façon : il indique bien le type de relation (place=country, place=city...) Il se trouve que le site web a évolué entre temps et que dans la liste des résultats parmi ceux qu'on peut choisir, il ne précise plus rien (il faut consulter le détail). Nominatim lui-m^rme n'est pas en cause, mais ici c'est plutôt le site web gérant le formulaire de recherche dans la base Nominatim. Si je fais la recherche Nominatim dans JOSM, on a encore les détails nécessaires dans les listes de résultats. Si Nominatim était clair, il ne devrait pas afficher la ville ou l'arrondissement tout seul mais toujours les indiquer avec leur adresse complète (du plus fin au plus large) et dans ce cas la différence est manifeste. Nominatim n'a effectivement pas à choisir, mais il doit trier les résulats multiples selon un critère de pertinence (et dans ce cas il risque de ne pas tout afficher sur la même page s'il y a trop de résultats. Tant qu'il abrège pas ses résultats en n'indiquant QUE le nom recherché et pas dans quoi il se situe, il n'y a pas de confusion possible. Nominatim tri par pertinence (on voit ce paramètre sur la page détail), c'est le calcul de ce paramètre qui est délicat. Si je compare Caen et Cognac (mon exemple) j'obtiens Caen (ville, admin 8) Importance : 0.64 Il y a un lien wikipédia, mais aussi capital, city et population Caen (arrondissement, admin 7) Importance : 0.39 Il y a un lien wikipédia et l'odre est logique (ville, puis arrondissement) Par contre pour Cognac j'ai : Cognac (arrondissement) Importance : 0.35 pas de lien wikipédia mais un tag population Cognac (ville) Importance : 0.52 pas de lien wikipédia Donc a priori j'aurai tendance a dire (mais rien de scientifique), que le lien wikipédia a peu d'importance (si il est le même entre la ville et l'arrondissement ; avec ou sans) Que la population ne permet pas de privilégier l'un ou l'autre et que par défaut Nominatim met en avant l'admin_level de plus faible (donc le plus grand) Ce qui permettrait a Caen de bien s'ordonner c'est l'ajout de capital ou city... Mais bon en même j'ai l'impression de tagger pour le rendu -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Oui mais on peut aussi chercher une ville (voir un village ou lieu-dit) dans un arrondissement, un département, une région, un pays, un continent. Toute précision ajoutée sert de filtre supplémentaire. Mais c'est vrai qu'un résultat où Caen appreit deux fois (celui affichant la ville et l'arrondissement, et pas seulement l'arrondissement) sera toujours plus pertinent. Maintenant que se passe-t-il si on cherche rue de Cherbourg, Caen ? Nominatim voit une recherche de Cherbourg et de Caen, il peut trouver une rue de Caen à Cherbourg ou une rue de Cherbourg à Caen et peut tout autant chercher dans une ville des deux villes ou dans un des deux arrondissements. Il n'y a pas de placement évident, sauf que cette fois Nominatim dispose d'une info : la rercherche mentionne en géréral les mots dnas un ordre comparable à une adresse et donc si on a précisé rue de , le nom qui suit est important à assirer avec rue et non avec le mot suivant qui est une autre ville. Nominatim devrait donc avoir des règles lui permettant de reconnaitre certaines associations dans un ordre précis. (rue de ne s'associe qu'avec les mots les plus proches dans la chaine de recherche avant les mots les plus éloignés) Eh bien même dans ce cas rue de Cherbourg, Caen devrait bien chercher une rue de Cherbourg et non une rue de Caen. sachant ensuite qu'on a ajouté une autre précision Caen, celle-ci n'est plus associée à rue de. La rue de Cherbourg trouvée étant trouvée, Nominatim doit chercher la précision la plus proche et ce ne peut être en priorité que la ville et non un arrondissment. Le malheur dans tout ça est que les noms de rues ou routes n'oéissent pas au schéma hiérarchique et peuvent s'étendre sur toute une série de communes voire un département entier ou plusieurs régions (par exemple RN137), même si rapidement il n'y a plus moyen de gérer une numérotation. Où chercher alors cette rue/route ? Dans une ville ? un arrondissement, un département, une région ? Ce n'est pas simple mais si on a le choix, les résultats concernant les zones de recherche les plus petites sont plus pertinents tout de même. Bref utiliser wikipedia=* ne sert à rien, il est plus là pour gêner qu'autre chose. Ce n'est pas un critère valable. Le 19 mars 2013 20:03, Francescu GAROBY windu...@gmail.com a écrit : Oui, mais une rue (comme celle que je cherchais) qui se trouve dans la commune de Caen, se trouve forcément dans l'arrondissement de Caen, alors que les autres solutions proposées ne sont que dans l'arrondissement de Caen. On pourrait alors penser qu'en tapant rue Eugène Boudin, Caen, il vaudrait mieux privilégier le cas où Caen désigne commune et arrondissement, car il remplit plus de conditions que les autres résultats. Autre raison : on cherche plus souvent une adresse dans une commune qu'une adresse dans un arrondissement (qui connait vraiment les limites des arrondissements ?). Francescu Le 19 mars 2013 19:47, Pierre-Alain Dorange pdora...@mac.com a écrit : Philippe Verdy verd...@wanadoo.fr wrote: Bien du courage pour expliquer à Brian Quinion pourquoi la France ferait exception dans Nominatim. Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon de calculer la sélectivité (puisqu'il ne tient pas compte de l'admin_level). Pas la peine de surcharger les noms pour autant. Je suis pas sur... Le soucis a mon sens provient vraiment de l'homonymie Caen (Ville) et Caen (Arrondissement). Nominatim n'a aucun moyen de savoir qui privilégier et même il faudrai privilégier l'arrondissement car d'admin_level plus faible donc de sens plus large. De même qui (si ça existe) il faudrait privilégier a priori une recherche sur une région plutot que sur une ville ou un quartier (qui aurait le même nom)... Je sais pas si je suis très clair. Je rencontre exactement le même problème (je viens du publier mon soucis avant le lire cette enfilade... erreur fatale). Et dans mon cas (Cognac) je ne vois pas d'autres solutions que d'aider nominatim en précisant la dénomination, et donc en ajoutant Arrondissement de Cognac à l'admin_level 7. Prenons un cas purement théorique (pour éviter de se focaliser sur un exemple) ou on aurait tout les niveaux admin_level avec le même nom (c'est con mais c'est un exemple pour pousser l'algorythme à bout). Si l'utilisateur fait un recherche sur le simple nom, que faut-t'il privilégier ? Le pays, la région, le département, la ville ou le quartier... Que cherche l'utilisateur ? Et dans le cas ou la recherche c'est nom d'une rue, xxx il est probable que cette rue existe de nombreuse fois dans le pays, que chercher vraiment l'utilisateur... le plus haut niveau (pays) ou le plus bas (quartier) ? Je suis pas sur qu'il y ait de réponse simple... -- Pierre-Alain Dorange OSM experiences : http://www.leretourdelautruche.com/map/ ___ Talk-fr mailing list Talk-fr@openstreetmap.org
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Le 19 mars 2013 20:03, Francescu GAROBY windu...@gmail.com a écrit : Oui, mais une rue (comme celle que je cherchais) qui se trouve dans la commune de Caen, se trouve forcément dans l'arrondissement de Caen, alors que les autres solutions proposées ne sont que dans l'arrondissement de Caen. On pourrait alors penser qu'en tapant rue Eugène Boudin, Caen, il vaudrait mieux privilégier le cas où Caen désigne commune et arrondissement, car il remplit plus de conditions que les autres résultats. Entièrement d'accord sur ce point, le résultat a des chances d'être plus pertinent si il y a cumul. Autre raison : on cherche plus souvent une adresse dans une commune qu'une adresse dans un arrondissement (qui connait vraiment les limites des arrondissements ?). C'est pas si évident que ça... Nominatim classe chaque toponyme par niveau, en reprenant les admin_level et en descendant encore plus bas. Si on considère qu'un niveau admin plus local est prioritaire, une rue se trouvant dans un hameau portant le même nom qu'une grande ville sortira en premier. D'où l'idée d'utiliser wikipédia pour tenter de déterminer l'importance d'un toponyme qui permet de dire que le nom d'un hameau est moins important que le nom d'une ville dans le cas des homonymes. Le cas des homonymes de Cognac est intéressant... rue de l'église, Cognac - c'est bien la ville de Cognac qui devrait sortir avant un éventuel hameau portant le même nom et ayant aussi une rue de l'église... enfin, il me semble, non ? Il ne faut pas oublier non plus que les admin_level sont différents d'un pays à l'autre et les conventions d'adressage aussi... et que Nominatim essaye de gérer tout ça de façon globale. -- Christian Quest - OpenStreetMap France Synthèse du Week-end SOTM-FR à Lyon : http://openstreetmap.fr/synthese-sotmfr ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Le 19/03/2013 20:43, Christian Quest a écrit : Le 19 mars 2013 20:03, Francescu GAROBY windu...@gmail.com a écrit : Oui, mais une rue (comme celle que je cherchais) qui se trouve dans la commune de Caen, se trouve forcément dans l'arrondissement de Caen, alors que les autres solutions proposées ne sont que dans l'arrondissement de Caen. On pourrait alors penser qu'en tapant rue Eugène Boudin, Caen, il vaudrait mieux privilégier le cas où Caen désigne commune et arrondissement, car il remplit plus de conditions que les autres résultats. Entièrement d'accord sur ce point, le résultat a des chances d'être plus pertinent si il y a cumul. Autre raison : on cherche plus souvent une adresse dans une commune qu'une adresse dans un arrondissement (qui connait vraiment les limites des arrondissements ?). Le sous-préfet ? :-) Il ne faut pas oublier non plus que les admin_level sont différents d'un pays à l'autre et les conventions d'adressage aussi... et que Nominatim essaye de gérer tout ça de façon globale. En effet, et ce dernier point reste à mon avis un des noeuds du problème. Chaque pays a sa propre logique d'imbrication des zones, d'ailleurs pas forcément administratives (penser aux zones postales aux USA par ex.). En observant les tableaux de cette page : http://wiki.openstreetmap.org/wiki/Tag:boundary%3Dadministrative on peut constater que chaque pays fait son marché parmi les 10 voire 11 niveaux conventionnels. Aucun niveau (= aucune colonne) n'est utilisé à 100% hormis le 2 (frontières de pays). Par suite, traiter uniformément (à quelques hacks près) tous les pays donne nécessairement des résultats discutables, selon le pays. L'importance donnée chez nous aux arrondissements (de part leur admin_level) par le moteur en est une illustration : le focus est mis sur la valeur d'admin_level, et non sur l'usage, qui en France occulte ce niveau, encadré qu'il est par deux niveaux très discriminants et utilisés en permanence : commune et département. vincent ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
2013/3/19 Christian Quest cqu...@openstreetmap.fr: On pourrait alors penser qu'en tapant rue Eugène Boudin, Caen, il vaudrait mieux privilégier le cas où Caen désigne commune et arrondissement, car il remplit plus de conditions que les autres résultats. Entièrement d'accord sur ce point, le résultat a des chances d'être plus pertinent si il y a cumul. Je crois rêver quand je lis ce genre de commentaires. Qui connait les noms des arrondissements ? Qui connait les limites des arrondissements ? Qui connait les arrondissements comme subdivision administrative en dehors des arrondissements de Paris, Lyon et Marseille : oups, pardn, c'est pas les mêmes Sur un million de gens qui cherchent la rue Boudin à Caen, combien pensent à l'arrondissement de Caen ? 2 ? 3 ? 1 ? aucun ? Il faut savoir parfois revenir dans le vrai monde IRL... On croit entendre un sketch du très grand Raymond Devos : - Pour Caen, quelle heure ? - pour où ? - Pour Caen - Comment voulez-vous que je vous dise quand, si je ne sais pas où ? C'est quand même incroyable de devoir dépendre d'un projet externe (wikipedia) qui lui n'hésite pas à nommer les choses par leur nom (wikipedia=fr:Arrondissement de Caen) pour compenser les tergiversations de quelques contributeurs OSM. Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
[OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Bonjour, En cherchant rue Eugène Boudin, Caen, sur www.openstreetmap.org, je me rends compte que Nominatim ne classe pas les résultats selon leur pertinence (ou le fait mal). En effet, le résultat qui m'intéresse (et qui est le bon) apparait en 3ème position, cf. ci-dessous : * Rue résidentielle Rue Eugène Boudin, May-sur-Orne, Caen, Calvados, Basse-Normandie, 14320, France * Rue résidentielle Rue Eugène Boudin, Saint-Martin-de-Fontenay, Caen, Calvados, Basse-Normandie, 14320, France * *Route tertiaire Rue Eugène Boudin, Verte Vallée, Caen, Calvados, Basse-Normandie, 14000, France, European Union* Les deux premiers sont des rues dans d'autres communes que celle qui m'intéresse *et que j'ai explicitement indiquée dans la demande*. Par contre, les 3 communes font partie de l'arrondissement de Caen (et donc du même département, même région, ...). et les deux premiers résultats sont des rues résidentielles. Les causes de ce tri se situeraient-elles là ? Ou je suis bon pour ouvrir un bug ? Francescu ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Intéresse-toi à la valeur admin_level indiquée pour Vallée Verte : ce devrait être un quartier (admin_level=10) et non une commune (admin_level=8) comme les 2 autres (May-sur-Orne, Saint-Martin-de-Fontenay). Note que la recherche trouve Caen malgré tout en tant que nom d'arrondissement (admin_level=7 mais normalement moins pertinent). Il est possible aussi que les frontières du quartier Vallée Verte soient brisées (non fermées) et qu'alors Nominatim utilise une heuristique basée sur les distances à un noeud place pour tenter de devenir son admin_level, cette heuristique peut parfois échouer et peut conduire à mal calculer la pertinence. Attnetion: Nominatim ne met pas sa base à jour entièrement en continu, il peut donc y avoir un décalage avec ce qui est dans la base OSM. Et parfois il lui arrive de garder très longtemps des infos obsolètes sur d'anciennes relations qui n'existent plus et qu'il ne retrouve plus jamais dans aucune mise à jour, parce qu'il a omis de traiter une suppression d'objet : vérifie donc les relations concernées, pour voir si elles sont toutes correctement fermées et taguées correctement, fais les corrections nécessaires, puis attends une bonne semaine pour vérifier si Nominatim a bien pris en compte les modifs. Si cela est lié à des infos obsolètes dans sa basen ouvre un ticket sur Nominatim pour demander un nettoyage (cela peut prendre du temps). Le 18 mars 2013 11:31, Francescu GAROBY f.gar...@gmail.com a écrit : En cherchant rue Eugène Boudin, Caen, sur www.openstreetmap.org, je me rends compte que Nominatim ne classe pas les résultats selon leur pertinence (ou le fait mal). En effet, le résultat qui m'intéresse (et qui est le bon) apparait en 3ème position, cf. ci-dessous : * Rue résidentielle Rue Eugène Boudin, May-sur-Orne, Caen, Calvados, Basse-Normandie, 14320, France * Rue résidentielle Rue Eugène Boudin, Saint-Martin-de-Fontenay, Caen, Calvados, Basse-Normandie, 14320, France * Route tertiaire Rue Eugène Boudin, Verte Vallée, Caen, Calvados, Basse-Normandie, 14000, France, European Union ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
En regardant le détail des résultats Nominatim, on voit bien qu'il y a une petite différence. Pour le résultat espéré: http://nominatim.openstreetmap.org/details.php?place_id=94524123 Nominatim a bien rangé cette rue dans la ville et l'arrondissement de Caen, mais ne semble pas le retourner en priorité par rapport aux deux autres résultats qui sont uniquement dans l'arrondissement de Caen : http://nominatim.openstreetmap.org/details.php?place_id=73716808 http://nominatim.openstreetmap.org/details.php?place_id=93907448 mais quand même avant ces 2 autres... http://nominatim.openstreetmap.org/details.php?place_id=87769797 http://nominatim.openstreetmap.org/details.php?place_id=52401589 Ca vaut le coup d'un rapport de bug à mon avis en indiquant les liens ci-dessus... Le 18 mars 2013 11:31, Francescu GAROBY f.gar...@gmail.com a écrit : Bonjour, En cherchant rue Eugène Boudin, Caen, sur www.openstreetmap.org, je me rends compte que Nominatim ne classe pas les résultats selon leur pertinence (ou le fait mal). En effet, le résultat qui m'intéresse (et qui est le bon) apparait en 3ème position, cf. ci-dessous : * Rue résidentielle Rue Eugène Boudin, May-sur-Orne, Caen, Calvados, Basse-Normandie, 14320, France * Rue résidentielle Rue Eugène Boudin, Saint-Martin-de-Fontenay, Caen, Calvados, Basse-Normandie, 14320, France * Route tertiaire Rue Eugène Boudin, Verte Vallée, Caen, Calvados, Basse-Normandie, 14000, France, European Union Les deux premiers sont des rues dans d'autres communes que celle qui m'intéresse et que j'ai explicitement indiquée dans la demande. Par contre, les 3 communes font partie de l'arrondissement de Caen (et donc du même département, même région, ...). et les deux premiers résultats sont des rues résidentielles. Les causes de ce tri se situeraient-elles là ? Ou je suis bon pour ouvrir un bug ? Francescu ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr -- Christian Quest - OpenStreetMap France Synthèse du Week-end SOTM-FR à Lyon : http://openstreetmap.fr/synthese-sotmfr ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Bonjour, De : Christian Quest Ca vaut le coup d'un rapport de bug à mon avis en indiquant les liens ci-dessus... D'accord avec ça. C'est (indirectement) ce qu'on évoquait en février au sujet, déjà, des arrondissements [1]. Ce niveau admin (niveau 7) devrait être occulté par Nominatim sur la France compte tenu de l'homonymie entre les noms d'arrondissements et des noms de ville, et surtout de l'usage français qui combine les niveaux département et ville dans la manière de désigner un endroit. vincent [1] : http://lists.openstreetmap.org/pipermail/talk-fr/2013-February/054457.html Laposte.net, messager officiel du Rallye des Gazelles en 2013 ! Pour suivre le Rallye Aïcha des Gazelles et soutenir les participantes, cliquez sur www.laposte.net/thematique/rallye-des-gazelles ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
2013/3/18 Vincent de Chateau-Thierry v...@laposte.net: Ca vaut le coup d'un rapport de bug à mon avis en indiquant les liens ci-dessus... D'accord avec ça. C'est (indirectement) ce qu'on évoquait en février au sujet, déjà, des arrondissements [1]. Ce niveau admin (niveau 7) devrait être occulté par Nominatim sur la France compte tenu de l'homonymie entre les noms d'arrondissements et des noms de ville, C'est l'homonymie qui est une erreur. Parce que lorsque quelqu'un lit ou écrit Caen, tout le monde comprend Caen : la ville. Tout le monde sauf les quelques-uns qui ont taggué les arrondissements dans OSM... Notez que ce problème d'homonymie a été résolu aux USA en ajoutant County là où il fallait et personne n'en est mort. Bien du courage pour expliquer à Brian Quinion pourquoi la France ferait exception dans Nominatim. Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Le 18 mars 2013 13:53, Vincent de Chateau-Thierry v...@laposte.net a écrit : D'accord avec ça. C'est (indirectement) ce qu'on évoquait en février au sujet, déjà, des arrondissements [1]. Ce niveau admin (niveau 7) devrait être occulté par Nominatim sur la France compte tenu de l'homonymie entre les noms d'arrondissements et des noms de ville, et surtout de l'usage français qui combine les niveaux département et ville dans la manière de désigner un endroit. Ce n'est pas spécifique à la France, mais c'est le cas dans de nombreux pays au niveau 7 (par exemple pour les arrondissements de Belgique, les districts en Suisse, dans certains endroits pour les comarques en Espagne, pour les comtés aux USA (qui portent le nom d'une ville) Bien des subdivisions adminsitratives sont nommées de façon homonymes avec leur chef-lieu ou capitale car le toponyme traditionnel de région n'est pas utilisé et aucun autre nom n'a été inventé... Selon les pays, l'unicité des noms de villes/municipalités/communes n'est garanti officiellement qu'à un certain niveau (en Espagne c'est au niveau 6, celui des provinces, comme en France au niveau 6 pour le niveau département). Maintenant Nominatim n'est pas fait QUE pour chercher des noms de villes. Aussi le terme occulter est mal venu, il n'y a pas de raison de la cacher, juste de prendre en compte leur sélectivité en fonction de l'admin_level. Ici on a un problème car Nominatim voit d'un côté : - rue, quartier, ville,... et de 'lautre - rue, ville, arrondissement... Et il est évident que la sélectivité du premier cas est supérieure (rue, niveau 10, niveau 8 ; contre rue, niveau 8, niveau 7 moins pertinent). ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Je comprends bien le problème de l'homonymie, mais il y a tout de même une différence entre Caen et Caen : l'un est en admin_level=8 (la commune), l'autre en admin_level=7 (l'arrondissement). Et ça, ça devrait suffire à différencier les 2 relations et comprendre leur hiérarchie (l'une dans l'autre). Du coup, mettre en premier des rues qui sont dans l'arrondissement de Caen, avant celle qui se trouve dans la commune de Caen (et donc aussi dans l'arrondissement éponyme) me semble un bug plutôt facile à corriger, non ? Francescu Le 18 mars 2013 14:34, Pieren pier...@gmail.com a écrit : 2013/3/18 Vincent de Chateau-Thierry v...@laposte.net: Ca vaut le coup d'un rapport de bug à mon avis en indiquant les liens ci-dessus... D'accord avec ça. C'est (indirectement) ce qu'on évoquait en février au sujet, déjà, des arrondissements [1]. Ce niveau admin (niveau 7) devrait être occulté par Nominatim sur la France compte tenu de l'homonymie entre les noms d'arrondissements et des noms de ville, C'est l'homonymie qui est une erreur. Parce que lorsque quelqu'un lit ou écrit Caen, tout le monde comprend Caen : la ville. Tout le monde sauf les quelques-uns qui ont taggué les arrondissements dans OSM... Notez que ce problème d'homonymie a été résolu aux USA en ajoutant County là où il fallait et personne n'en est mort. Bien du courage pour expliquer à Brian Quinion pourquoi la France ferait exception dans Nominatim. Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Le 18 mars 2013 14:34, Pieren pier...@gmail.com a écrit : Bien du courage pour expliquer à Brian Quinion pourquoi la France ferait exception dans Nominatim. Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon de calculer la sélectivité (puisqu'il ne tient pas compte de l'admin_level). Pas la peine de surcharger les noms pour autant. ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
J'ouvrirai un bug ce soir, en expliquant tout ça (merci cquest pour les liens vers les détails de nominatim : je ne connaissais pas et c'est bien pratique). Francescu Le 18 mars 2013 14:38, Philippe Verdy verd...@wanadoo.fr a écrit : Le 18 mars 2013 14:34, Pieren pier...@gmail.com a écrit : Bien du courage pour expliquer à Brian Quinion pourquoi la France ferait exception dans Nominatim. Il n'y a pas d'exception. Nominatim a bien une anomalie dans sa façon de calculer la sélectivité (puisqu'il ne tient pas compte de l'admin_level). Pas la peine de surcharger les noms pour autant. ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Tu y a facilement accès via http://nominatim.openstreetmap.org/ Le 18 mars 2013 14:41, Francescu GAROBY windu...@gmail.com a écrit : J'ouvrirai un bug ce soir, en expliquant tout ça (merci cquest pour les liens vers les détails de nominatim : je ne connaissais pas et c'est bien pratique). Francescu -- Christian Quest - OpenStreetMap France Synthèse du Week-end SOTM-FR à Lyon : http://openstreetmap.fr/synthese-sotmfr ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Le 18 mars 2013 14:37, Francescu GAROBY windu...@gmail.com a écrit : Je comprends bien le problème de l'homonymie, mais il y a tout de même une différence entre Caen et Caen : l'un est en admin_level=8 (la commune), l'autre en admin_level=7 (l'arrondissement). Et ça, ça devrait suffire à différencier les 2 relations et comprendre leur hiérarchie (l'une dans l'autre). Du coup, mettre en premier des rues qui sont dans l'arrondissement de Caen, avant celle qui se trouve dans la commune de Caen (et donc aussi dans l'arrondissement éponyme) me semble un bug plutôt facile à corriger, non ? Je suis du même avis : quand on recherche quelquechose, la pertinence doit prendre en compte dans la chaîne de recherche ce qui est les plus pertinent, c'est à dire le plus local. Même s'il y a des homonymies (et elles sont nombreuses étant donné que Nominatim est une base de données mondiale). Changer localement un nom pour faire joli dans les résultats de Nominatim ne changera rien à l'ordre de tri des résultats (car même si on a renommé en admin_level=7 Caen en Arrondissement de Caen, cela restera retourné malgré tout dans la recherche de nom de rue, Caen (Nominatim fait une recherche globale des mots et n'a aucune idée d'où couper, me^me si on a mis une virgule dans la chaîne de recherche, d'autant plus qu'on peut rechercher sans mettre de majuscules, ni d'accents ni aucune autre ponctuation, et que les résultats pertinents doivent pourtant être classés (il n'y a pas de virgule par exemple dans la base OSM qui stocke des noms séparés). Nominatim utilise ausi d'autres critères pour la pertinence : pour classer les villes il se base sur leur classification (city, town, village,...) et si des données sont disponibles sur les chiffres de population. Actuellement le fait qu'il ait affiché les 3 résultats n'est pas une anomalie en elle-même, c'est juste un problème de tri de la liste retournée par pertinence (car Nominatim n'affiche pas toujours en une seule requête tous les résultats possibles mais en retourne quelques-uns selon leur degré de pertinence calculé, un degré de pertinence qu'il affiche d'ailleurs dans ses résultats et tient compte de divers tags, en donnant ensuite la possibilité à l'utilisateur de chercher d'autres résultats moins pertinents). ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
2013/3/18 Philippe Verdy verd...@wanadoo.fr: Nominatim utilise ausi d'autres critères pour la pertinence : pour classer les villes il se base sur leur classification (city, town, village,...) et si des données sont disponibles sur les chiffres de population. Je cherche justement les détails sur l'algorythme de recherche. Tu as un lien à passer ? Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Y a un ersatz d'explications ici : http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview Francescu Le 18 mars 2013 15:31, Pieren pier...@gmail.com a écrit : 2013/3/18 Philippe Verdy verd...@wanadoo.fr: Nominatim utilise ausi d'autres critères pour la pertinence : pour classer les villes il se base sur leur classification (city, town, village,...) et si des données sont disponibles sur les chiffres de population. Je cherche justement les détails sur l'algorythme de recherche. Tu as un lien à passer ? Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Et le code est là : https://github.com/twain47/Nominatim (désolé pour le double-mail : je me suis pris les moufles dans le clavier...) Francescu Le 18 mars 2013 15:34, Francescu GAROBY windu...@gmail.com a écrit : Y a un ersatz d'explications ici : http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview Francescu Le 18 mars 2013 15:31, Pieren pier...@gmail.com a écrit : 2013/3/18 Philippe Verdy verd...@wanadoo.fr: Nominatim utilise ausi d'autres critères pour la pertinence : pour classer les villes il se base sur leur classification (city, town, village,...) et si des données sont disponibles sur les chiffres de population. Je cherche justement les détails sur l'algorythme de recherche. Tu as un lien à passer ? Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr -- Cordialement, Francescu GAROBY -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Hormi regarder les sources... Mais une partie est documentée, le reste a été décrit par des discussions passées mais c'est un algo en évolution perpétuelle. Le 18 mars 2013 15:31, Pieren pier...@gmail.com a écrit : 2013/3/18 Philippe Verdy verd...@wanadoo.fr: Nominatim utilise ausi d'autres critères pour la pertinence : pour classer les villes il se base sur leur classification (city, town, village,...) et si des données sont disponibles sur les chiffres de population. Je cherche justement les détails sur l'algorythme de recherche. Tu as un lien à passer ? ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
2013/3/18 Francescu GAROBY windu...@gmail.com: Y a un ersatz d'explications ici : http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview Vi, je connais. C'est une doc à la verdy_p: Search Algorithm TODO En creusant un peu, je trouve les requêtes ici mais le code est imbuvable: https://github.com/twain47/Nominatim/blob/master/website/search.php Je vais essayer de m'y plonger sans me noyer... On voit bien deux order by importance desc. D'un autre côté, les notes de la version 2 disent search logic in java (http://wiki.openstreetmap.org/wiki/Nominatim/Version2). Comprenne qui pourra. Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
2013/3/18 Pieren pier...@gmail.com: 2013/3/18 Francescu GAROBY windu...@gmail.com: Y a un ersatz d'explications ici : http://wiki.openstreetmap.org/wiki/Nominatim/Development_overview Vi, je connais. C'est une doc à la verdy_p: Search Algorithm TODO Je n'y suis pour tien du tout ! En creusant un peu, je trouve les requêtes ici mais le code est imbuvable: https://github.com/twain47/Nominatim/blob/master/website/search.php Je vais essayer de m'y plonger sans me noyer... On voit bien deux order by importance desc. D'un autre côté, les notes de la version 2 disent search logic in java (http://wiki.openstreetmap.org/wiki/Nominatim/Version2). Comprenne qui pourra. Effectivement c'est imbuvable, mais avant de se demander comment il fonctionne il faut savoir comment le code d'importation de ses tables Gazetteer mappe les tags OSM en features Gazetteer. Je ne vois rien dans ce code qui semble indiquer qu'il gère les quartiers de villes ; les arrondissements français en revanche devraient être traités comme les place=county aux USA, c'est à priori le même admin_level=7. Mais dans ce paquet infâme et illisible d'expressions régulières (surtout destiné à gérer les règles orthographiques de la toponymie et les hiérarchies administratives des pays anglophones, avec des exceptions incluses pour les germanophones et des hacks avoués pour l'Etat de New York), qui sait ce que cela fait en France, même si on fait une recherche Nominatim en anglais (je n'ai pas testé si les résultats sont différents, à priori cela ne devrait pas l'être au niveau des sélections et tris de résultats) ! Assez souvent, pour le guider il faut ajouter des tags d'annotation lui permettant de classer certains éléments correctement. ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr