Le 07/07/2014 02:18, Pierre Knobel a écrit :
Désolé, je répond sur une tablette et j'ai des gros doigts. Je disais
que je me demande si on ne pouvait pas descendre le seuil de 5 à 3, voir
2, si on ne s'intéresse qu'aux voies qui n'ont pas déjà été rapprochées
par les autres méthodes.
Je n'ai pas regardé de près le code source des outils de rapprochement,
mais j'imagine quelque chose du genre : sur une commune donnée, on
trouve d'abord toutes les voies dont le nom FANTOIR est identique à
celui d'OSM, puis sur les voies restantes on essaye de résoudre les
abréviations, et pour finir on s'intéresse à toutes les voies restantes
qui ont le même suffixe. Si en enlevant le suffixe on trouve une
correspondance dans OSM, bingo.
Je ne vois pas de gros risque d'effet de bord à appliquer ça dès qu'on a
deux rues avec un suffixe commun. Peut-être même qu'il faudrait aller
jusqu'à tenter de virer le dernier mot des rues uniques pour voir si ça
ne permet pas le rapprochement.
Ça permettrait de traiter les nombreux touts petits hameaux.
Je n'ai pas testé trop de seuils différents pour l'instant. Je
regarderai (ce soir) pour publier un zonage basé sur moins que 5. Et en
effet, en traitant d'abord ce qui peut l'être hors suffixe, le risque de
mélange devient faible.
Pour l'instant je pensais prendre le problème à l'envers, en suffixant
les voies et adresses OSM incluses dans chaque zone avec le mot / couple
de mots trouvé dans Fantoir et Cadastre sur la zone, afin de pouvoir
traiter chaque commune en 1 seule passe comme aujourd'hui. C'est ce qui
me semblait le meilleur compromis pour éviter n itérations partielles
par commune, et le risque d'usine à gaz. La surcharge des noms OSM
n'aurait bien sûr lieu qu'à la volée pour le rapprochement, le nom
utilisé au final dans l'export Bano étant le nom OSM d'origine.
vincent
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr