Re: [OSM-dev-fr] Import des numéros de rue (addr:housenumber) depuis le Cadastre
Bonjour, J'ai également tenté de faire ça. Mais généralisé à tout le texte. J'avais commencé par faire une approche par signature de forme sur les composantes du chemin décrivant la forme (comme la tentative de 2010). Mais pour les raisons précédemment évoquées c'est vite limité. Au passage noter que qadastre fait une simplification qu'il faut désactiver pour faire des analyses sur la forme d'origine. J'étais donc parti sur une autre piste. Le détection des caractères pas comparaison de critère : ratio de taille, de périmètre, nombre de ligne droites significatives, détection d'angles, d'intérieurs... le tout avec une détection et la correction de l'orientation du texte pour diminuer les faux positif. Le résultat est bien indépendant de la taille du pdf. Mais la qualité n'est toujours pas suffisante pour donner un résultat exploitable même en augmentant la base statistique de référence. Je peux te donner les sources, c'est un qadastre modifié avec une extension en ruby. Fred Le 3 novembre 2011 08:14, Ab_fab gamma@gmail.com a écrit : Il faudrait contacter en direct le principal intéressé, car il n'est plus actif sur la liste de diffusion. Le 3 novembre 2011 00:14, Tyndare tynd...@wanadoo.fr a écrit : Ca correspond exactement à ce que j’essayai de faire, il est accessible quelque part ce programme ? Le 2 novembre 2011 22:57, Ab_fab gamma@gmail.com a écrit : Bonsoir, Je ne serai pas d'une grande aide sur la question, mais j'ai ce fil de discussion de juillet 2010 à te proposer : http://lists.openstreetmap.org/pipermail/talk-fr/2010-July/thread.html#24030 ___ dev-fr mailing list dev-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/dev-fr -- ab_fab Il n'y a pas de pas perdus ___ dev-fr mailing list dev-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/dev-fr ___ dev-fr mailing list dev-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/dev-fr
Re: [OSM-dev-fr] Import des numéros de rue (addr:housenumber) depuis le Cadastre
Là... respect! Dites, la communauté OSM-FR, je crois que l'on est bien accompagné !! Le 3 novembre 2011 09:49, Frédéric Rodrigo fred.rodr...@gmail.com a écrit : Bonjour, J'ai également tenté de faire ça. Mais généralisé à tout le texte. J'avais commencé par faire une approche par signature de forme sur les composantes du chemin décrivant la forme (comme la tentative de 2010). Mais pour les raisons précédemment évoquées c'est vite limité. Au passage noter que qadastre fait une simplification qu'il faut désactiver pour faire des analyses sur la forme d'origine. J'étais donc parti sur une autre piste. Le détection des caractères pas comparaison de critère : ratio de taille, de périmètre, nombre de ligne droites significatives, détection d'angles, d'intérieurs... le tout avec une détection et la correction de l'orientation du texte pour diminuer les faux positif. Le résultat est bien indépendant de la taille du pdf. Mais la qualité n'est toujours pas suffisante pour donner un résultat exploitable même en augmentant la base statistique de référence. Je peux te donner les sources, c'est un qadastre modifié avec une extension en ruby. Fred Le 3 novembre 2011 08:14, Ab_fab gamma@gmail.com a écrit : Il faudrait contacter en direct le principal intéressé, car il n'est plus actif sur la liste de diffusion. Le 3 novembre 2011 00:14, Tyndare tynd...@wanadoo.fr a écrit : Ca correspond exactement à ce que j’essayai de faire, il est accessible quelque part ce programme ? Le 2 novembre 2011 22:57, Ab_fab gamma@gmail.com a écrit : Bonsoir, Je ne serai pas d'une grande aide sur la question, mais j'ai ce fil de discussion de juillet 2010 à te proposer : http://lists.openstreetmap.org/pipermail/talk-fr/2010-July/thread.html#24030 ___ dev-fr mailing list dev-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/dev-fr -- ab_fab Il n'y a pas de pas perdus ___ dev-fr mailing list dev-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/dev-fr ___ dev-fr mailing list dev-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/dev-fr -- Cyrille. ___ dev-fr mailing list dev-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/dev-fr
Re: [OSM-dev-fr] Import des numéros de rue (addr:housenumber) depuis le Cadastre
Je suis partis sur une approche plus simpliste qui doit être similaire à ta première tentative. Je me contente des données récupérée par qadastre: un Path composé d'une liste de commandes (moveto, lineto, curveto) et une liste de coordonnées associées. J'ai pris comme à priori que les numéros de rue seraient toujours écris avec la même police et devrais donc être composés exactement des même commandes dans le même ordre.Ensuite pour comparer la liste des coordonnées associées aux commandes, j'applique une transformation (déplacement et rotation) pour ramener la première de la liste à (0,0) et la troisième à l'horizontale (en choisissant la deuxième ça ne marchait pas pour le chiffre 3) et je met le tout à échelle pour que ça rentre dans un carré d'1 de large. Ca a l'air très fiable si les coordonnées sont assez précises, et je pense que c'est généralisable au texte (chaque mot génère un Path mais il faut ensuite les assembler). Je n'ai pas regardé la simplification faite par qadastre, c'est où le bouton pou la désactiver ? Pour les problèmes de tailles, je commence à me dire qu'il n'y a pas d'autre solution que de repartir sur un découpage des requêtes au cadastre en plusieurs pdf comme le fait le script import-bati.sh Le programme de Benoît ROUSSEAU avait l'air très avancé. J’essaierais de le contacter directement si il ne se manifeste pas. Ludo. Le 3 novembre 2011 09:49, Frédéric Rodrigo fred.rodr...@gmail.com a écrit : Bonjour, J'ai également tenté de faire ça. Mais généralisé à tout le texte. J'avais commencé par faire une approche par signature de forme sur les composantes du chemin décrivant la forme (comme la tentative de 2010). Mais pour les raisons précédemment évoquées c'est vite limité. Au passage noter que qadastre fait une simplification qu'il faut désactiver pour faire des analyses sur la forme d'origine. J'étais donc parti sur une autre piste. Le détection des caractères pas comparaison de critère : ratio de taille, de périmètre, nombre de ligne droites significatives, détection d'angles, d'intérieurs... le tout avec une détection et la correction de l'orientation du texte pour diminuer les faux positif. Le résultat est bien indépendant de la taille du pdf. Mais la qualité n'est toujours pas suffisante pour donner un résultat exploitable même en augmentant la base statistique de référence. Je peux te donner les sources, c'est un qadastre modifié avec une extension en ruby. Fred ___ dev-fr mailing list dev-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/dev-fr
Re: [OSM-dev-fr] Import des numéros de rue (addr:housenumber) depuis le Cadastre
Le 3 novembre 2011 12:22, Tyndare tynd...@wanadoo.fr a écrit : Je suis partis sur une approche plus simpliste qui doit être similaire à ta première tentative. Je me contente des données récupérée par qadastre: un Path composé d'une liste de commandes (moveto, lineto, curveto) et une liste de coordonnées associées. J'ai pris comme à priori que les numéros de rue seraient toujours écris avec la même police et devrais donc être composés exactement des même commandes dans le même ordre. C'est un mauvais à priori. Le détail du chemin va dépendre de la taille des caractères. Le point de départ du chemin n'est pas toujours le même. Il faut vraiment travailler avec plusieurs communes, c'est là que se révèlent les problèmes. Ensuite pour comparer la liste des coordonnées associées aux commandes, j'applique une transformation (déplacement et rotation) pour ramener la première de la liste à (0,0) et la troisième à l'horizontale (en choisissant la deuxième ça ne marchait pas pour le chiffre 3) et je met le tout à échelle pour que ça rentre dans un carré d'1 de large. Ca a l'air très fiable si les coordonnées sont assez précises, et je pense que c'est généralisable au texte (chaque mot génère un Path mais il faut ensuite les assembler). Je n'ai pas regardé la simplification faite par qadastre, c'est où le bouton pou la désactiver ? C'est dans le code Pour les problèmes de tailles, je commence à me dire qu'il n'y a pas d'autre solution que de repartir sur un découpage des requêtes au cadastre en plusieurs pdf comme le fait le script import-bati.sh Le programme de Benoît ROUSSEAU avait l'air très avancé. J’essaierais de le contacter directement si il ne se manifeste pas. Ludo. Le 3 novembre 2011 09:49, Frédéric Rodrigo fred.rodr...@gmail.com a écrit : Bonjour, J'ai également tenté de faire ça. Mais généralisé à tout le texte. J'avais commencé par faire une approche par signature de forme sur les composantes du chemin décrivant la forme (comme la tentative de 2010). Mais pour les raisons précédemment évoquées c'est vite limité. Au passage noter que qadastre fait une simplification qu'il faut désactiver pour faire des analyses sur la forme d'origine. J'étais donc parti sur une autre piste. Le détection des caractères pas comparaison de critère : ratio de taille, de périmètre, nombre de ligne droites significatives, détection d'angles, d'intérieurs... le tout avec une détection et la correction de l'orientation du texte pour diminuer les faux positif. Le résultat est bien indépendant de la taille du pdf. Mais la qualité n'est toujours pas suffisante pour donner un résultat exploitable même en augmentant la base statistique de référence. Je peux te donner les sources, c'est un qadastre modifié avec une extension en ruby. Fred ___ dev-fr mailing list dev-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/dev-fr ___ dev-fr mailing list dev-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/dev-fr