Le 07/07/2014 02:18, Pierre Knobel a écrit :
Désolé, je répond sur une tablette et j'ai des gros doigts. Je disais
que je me demande si on ne pouvait pas descendre le seuil de 5 à 3, voir
2, si on ne s'intéresse qu'aux voies qui n'ont pas déjà été rapprochées
par les autres méthodes.

Je n'ai pas regardé de près le code source des outils de rapprochement,
mais j'imagine quelque  chose du genre : sur une commune donnée,  on
trouve d'abord toutes les voies dont le nom FANTOIR est identique à
celui d'OSM, puis sur les voies restantes on essaye de résoudre les
abréviations, et pour finir on s'intéresse à toutes les voies restantes
qui ont le même  suffixe. Si en enlevant le suffixe on trouve une
correspondance dans OSM,  bingo.
Je ne vois pas de gros risque d'effet de bord à appliquer ça dès qu'on a
deux rues avec un suffixe commun. Peut-être même qu'il faudrait aller
jusqu'à tenter de virer le dernier mot des rues uniques pour voir si ça
ne permet pas le rapprochement.

Ça permettrait de traiter les nombreux touts petits hameaux.

Je n'ai pas testé trop de seuils différents pour l'instant. Je regarderai (ce soir) pour publier un zonage basé sur moins que 5. Et en effet, en traitant d'abord ce qui peut l'être hors suffixe, le risque de mélange devient faible. Pour l'instant je pensais prendre le problème à l'envers, en suffixant les voies et adresses OSM incluses dans chaque zone avec le mot / couple de mots trouvé dans Fantoir et Cadastre sur la zone, afin de pouvoir traiter chaque commune en 1 seule passe comme aujourd'hui. C'est ce qui me semblait le meilleur compromis pour éviter n itérations partielles par commune, et le risque d'usine à gaz. La surcharge des noms OSM n'aurait bien sûr lieu qu'à la volée pour le rapprochement, le nom utilisé au final dans l'export Bano étant le nom OSM d'origine.

vincent

_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à