Au passage, si ça vient de la poste, c'est une base au format "adresse
postale", sans accents, sans tirets etc... ?

Qu'est-ce que je peste aussi contre ces absence dans le cadastre,
particulièrement sur les majuscule. C'est une ancienne limite technique ?

C'est pas bien compliqué de contourner ce problème et de faire un
rapprochement sur des chaines de caractères automatique. Perso, je fais ça
en python. Je génére des slug (sorte d'identifiant unique texte) et je fais
des comparaisons de nom entre sources de données différentes avant faire
mes jointures attributaires. Ensuite j'isole les données des sources dans
un sens comme dans l'autres pour voir ce qui n'a pas trouvé de
correspondance (nom alternatif...) pour ensuite faire une deuxième passe...

J'avais même intégré cette fonction dans PostgreSQL en PL/Python

La technique consiste à avoir les mêmes caractères de séparation et la même
case en ajoutant une fonction qui converti les caractères non ascii en
caratère ascii ou/et supprime des caractères non souhaitait (comme des
balise HTML). On peut même tester les correspondance de nom avec
abréviation.

voir ce code https://gist.github.com/turicas/1428479

Je pense qu'on pourrait aisément le faire pour l'ensemble des noms de rue
en incluant aussi une table de clé de valeurs de remplacement au besoin
(mais par commune car les prénoms peuvent être différent et l’abréviation
identique...)


Le 1 octobre 2014 10:20, Stéphane Péneau <stephane.pen...@wanadoo.fr> a
écrit :

> Le 01/10/2014 06:35, Vincent de Château-Thierry a écrit :
>
>>
>> Juste sur les n° temporaires du cadastre, il faut reconnaître qu'ils sont
>> aussi dans BANO, car rien en apparence de les différencie des autres. On
>> devrait pouvoir en détecter, ils sont souvent exprimés en milliers au
>> milieu d'autres numéros en unités ou dizaines, dans la même voie, mais on
>> ne s'est pas lancé là dedans pour l'instant.
>>
>
> Et filtrer les adresses isolées, à plusieurs kilomètres de la rue en
> question.
>
> Au passage, si ça vient de la poste, c'est une base au format "adresse
> postale", sans accents, sans tirets etc... ?
>
> Qu'est-ce que je peste aussi contre ces absence dans le cadastre,
> particulièrement sur les majuscule. C'est une ancienne limite technique ?
>
>
> Stf
>
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
>
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Reply via email to