Re: [OSM-dev-fr] Import des numéros de rue (addr:housenumber) depuis le Cadastre

2011-11-03 Par sujet Frédéric Rodrigo
Bonjour,
J'ai également tenté de faire ça. Mais généralisé à tout le texte.
J'avais commencé par faire une approche par signature de forme sur les
composantes du chemin décrivant la forme (comme la tentative de 2010).
Mais pour les raisons précédemment évoquées c'est vite limité. Au
passage noter que qadastre fait une simplification qu'il faut
désactiver pour faire des analyses sur la forme d'origine.
J'étais donc parti sur une autre piste. Le détection des caractères
pas comparaison de critère : ratio de taille, de périmètre, nombre de
ligne droites significatives, détection d'angles, d'intérieurs... le
tout avec une détection et la correction de l'orientation du texte
pour diminuer les faux positif. Le résultat est bien indépendant de la
taille du pdf. Mais la qualité n'est toujours pas suffisante pour
donner un résultat exploitable même en augmentant la base statistique
de référence.

Je peux te donner les sources, c'est un qadastre modifié avec une
extension en ruby.

Fred

Le 3 novembre 2011 08:14, Ab_fab gamma@gmail.com a écrit :
 Il faudrait contacter en direct le principal intéressé, car il n'est plus
 actif sur la liste de diffusion.

 Le 3 novembre 2011 00:14, Tyndare tynd...@wanadoo.fr a écrit :

 Ca correspond exactement à ce que j’essayai de faire, il est
 accessible quelque part ce programme ?

 Le 2 novembre 2011 22:57, Ab_fab gamma@gmail.com a écrit :
  Bonsoir,
 
  Je ne serai pas d'une grande aide sur la question, mais j'ai ce fil de
  discussion de juillet 2010 à te proposer :
 
  http://lists.openstreetmap.org/pipermail/talk-fr/2010-July/thread.html#24030

 ___
 dev-fr mailing list
 dev-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/dev-fr



 --
 ab_fab
 Il n'y a pas de pas perdus

 ___
 dev-fr mailing list
 dev-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/dev-fr



___
dev-fr mailing list
dev-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/dev-fr


Re: [OSM-dev-fr] Import des numéros de rue (addr:housenumber) depuis le Cadastre

2011-11-03 Par sujet cyrille giquello
Là... respect!
Dites, la communauté OSM-FR, je crois que l'on est bien accompagné !!

Le 3 novembre 2011 09:49, Frédéric Rodrigo fred.rodr...@gmail.com a écrit :
 Bonjour,
 J'ai également tenté de faire ça. Mais généralisé à tout le texte.
 J'avais commencé par faire une approche par signature de forme sur les
 composantes du chemin décrivant la forme (comme la tentative de 2010).
 Mais pour les raisons précédemment évoquées c'est vite limité. Au
 passage noter que qadastre fait une simplification qu'il faut
 désactiver pour faire des analyses sur la forme d'origine.
 J'étais donc parti sur une autre piste. Le détection des caractères
 pas comparaison de critère : ratio de taille, de périmètre, nombre de
 ligne droites significatives, détection d'angles, d'intérieurs... le
 tout avec une détection et la correction de l'orientation du texte
 pour diminuer les faux positif. Le résultat est bien indépendant de la
 taille du pdf. Mais la qualité n'est toujours pas suffisante pour
 donner un résultat exploitable même en augmentant la base statistique
 de référence.

 Je peux te donner les sources, c'est un qadastre modifié avec une
 extension en ruby.

 Fred

 Le 3 novembre 2011 08:14, Ab_fab gamma@gmail.com a écrit :
 Il faudrait contacter en direct le principal intéressé, car il n'est plus
 actif sur la liste de diffusion.

 Le 3 novembre 2011 00:14, Tyndare tynd...@wanadoo.fr a écrit :

 Ca correspond exactement à ce que j’essayai de faire, il est
 accessible quelque part ce programme ?

 Le 2 novembre 2011 22:57, Ab_fab gamma@gmail.com a écrit :
  Bonsoir,
 
  Je ne serai pas d'une grande aide sur la question, mais j'ai ce fil de
  discussion de juillet 2010 à te proposer :
 
  http://lists.openstreetmap.org/pipermail/talk-fr/2010-July/thread.html#24030

 ___
 dev-fr mailing list
 dev-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/dev-fr



 --
 ab_fab
 Il n'y a pas de pas perdus

 ___
 dev-fr mailing list
 dev-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/dev-fr



 ___
 dev-fr mailing list
 dev-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/dev-fr




-- 
Cyrille.

___
dev-fr mailing list
dev-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/dev-fr


Re: [OSM-dev-fr] Import des numéros de rue (addr:housenumber) depuis le Cadastre

2011-11-03 Par sujet Tyndare
Je suis partis sur une approche plus simpliste qui doit être similaire
à ta première tentative. Je me contente des données récupérée par
qadastre: un Path composé d'une liste de commandes (moveto, lineto,
curveto) et une liste de coordonnées associées.
J'ai pris comme à priori que les numéros de rue seraient toujours
écris avec la même police et devrais donc être composés exactement des
même commandes dans le même ordre.Ensuite pour comparer la liste des
coordonnées associées aux commandes, j'applique une transformation
(déplacement et rotation) pour ramener la première de la liste à (0,0)
et la troisième  à l'horizontale (en choisissant la deuxième ça ne
marchait pas pour le chiffre 3) et je met le tout à échelle pour que
ça rentre dans un carré d'1 de large.
Ca a l'air très fiable si les coordonnées sont assez précises, et je
pense que c'est généralisable au texte (chaque mot génère un Path mais
il faut ensuite les assembler).

Je n'ai pas regardé la simplification faite par qadastre, c'est où le
bouton pou la désactiver ?

Pour les problèmes de tailles, je commence à me dire qu'il n'y a pas
d'autre solution que de repartir sur un découpage des requêtes au
cadastre en plusieurs pdf comme le fait le script import-bati.sh

Le programme de Benoît ROUSSEAU avait l'air très avancé. J’essaierais
de le contacter directement si il ne se manifeste pas.

Ludo.


Le 3 novembre 2011 09:49, Frédéric Rodrigo fred.rodr...@gmail.com a écrit :
 Bonjour,
 J'ai également tenté de faire ça. Mais généralisé à tout le texte.
 J'avais commencé par faire une approche par signature de forme sur les
 composantes du chemin décrivant la forme (comme la tentative de 2010).
 Mais pour les raisons précédemment évoquées c'est vite limité. Au
 passage noter que qadastre fait une simplification qu'il faut
 désactiver pour faire des analyses sur la forme d'origine.
 J'étais donc parti sur une autre piste. Le détection des caractères
 pas comparaison de critère : ratio de taille, de périmètre, nombre de
 ligne droites significatives, détection d'angles, d'intérieurs... le
 tout avec une détection et la correction de l'orientation du texte
 pour diminuer les faux positif. Le résultat est bien indépendant de la
 taille du pdf. Mais la qualité n'est toujours pas suffisante pour
 donner un résultat exploitable même en augmentant la base statistique
 de référence.

 Je peux te donner les sources, c'est un qadastre modifié avec une
 extension en ruby.

 Fred

___
dev-fr mailing list
dev-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/dev-fr


Re: [OSM-dev-fr] Import des numéros de rue (addr:housenumber) depuis le Cadastre

2011-11-03 Par sujet Frédéric Rodrigo
Le 3 novembre 2011 12:22, Tyndare tynd...@wanadoo.fr a écrit :
 Je suis partis sur une approche plus simpliste qui doit être similaire
 à ta première tentative. Je me contente des données récupérée par
 qadastre: un Path composé d'une liste de commandes (moveto, lineto,
 curveto) et une liste de coordonnées associées.
 J'ai pris comme à priori que les numéros de rue seraient toujours
 écris avec la même police et devrais donc être composés exactement des
 même commandes dans le même ordre.

C'est un mauvais à priori. Le détail du chemin va dépendre de la
taille des caractères. Le point de départ du chemin n'est pas toujours
le même.

Il faut vraiment travailler avec plusieurs communes, c'est là que se
révèlent les problèmes.

 Ensuite pour comparer la liste des
 coordonnées associées aux commandes, j'applique une transformation
 (déplacement et rotation) pour ramener la première de la liste à (0,0)
 et la troisième  à l'horizontale (en choisissant la deuxième ça ne
 marchait pas pour le chiffre 3) et je met le tout à échelle pour que
 ça rentre dans un carré d'1 de large.
 Ca a l'air très fiable si les coordonnées sont assez précises, et je
 pense que c'est généralisable au texte (chaque mot génère un Path mais
 il faut ensuite les assembler).

 Je n'ai pas regardé la simplification faite par qadastre, c'est où le
 bouton pou la désactiver ?

C'est dans le code

 Pour les problèmes de tailles, je commence à me dire qu'il n'y a pas
 d'autre solution que de repartir sur un découpage des requêtes au
 cadastre en plusieurs pdf comme le fait le script import-bati.sh

 Le programme de Benoît ROUSSEAU avait l'air très avancé. J’essaierais
 de le contacter directement si il ne se manifeste pas.

 Ludo.


 Le 3 novembre 2011 09:49, Frédéric Rodrigo fred.rodr...@gmail.com a écrit :
 Bonjour,
 J'ai également tenté de faire ça. Mais généralisé à tout le texte.
 J'avais commencé par faire une approche par signature de forme sur les
 composantes du chemin décrivant la forme (comme la tentative de 2010).
 Mais pour les raisons précédemment évoquées c'est vite limité. Au
 passage noter que qadastre fait une simplification qu'il faut
 désactiver pour faire des analyses sur la forme d'origine.
 J'étais donc parti sur une autre piste. Le détection des caractères
 pas comparaison de critère : ratio de taille, de périmètre, nombre de
 ligne droites significatives, détection d'angles, d'intérieurs... le
 tout avec une détection et la correction de l'orientation du texte
 pour diminuer les faux positif. Le résultat est bien indépendant de la
 taille du pdf. Mais la qualité n'est toujours pas suffisante pour
 donner un résultat exploitable même en augmentant la base statistique
 de référence.

 Je peux te donner les sources, c'est un qadastre modifié avec une
 extension en ruby.

 Fred

 ___
 dev-fr mailing list
 dev-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/dev-fr


___
dev-fr mailing list
dev-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/dev-fr