A mon avis, il serait possible d'éprouver ton programme d'import, en
acceptant jusqu'à 80 %, en générant un import sur une zone clairement
délimité, afin de pouvoir juger sur pièces.
En comparant avec cadastre, openstreetview, terrain, ... chacun pourra
juger du degré d'approximation tolérable à son sens.
Brice
Le 02/04/2015 11:13, Vincent Frison a écrit :
Le 31 mars 2015 10:52, Vincent Frison <vincent.fri...@gmail.com
<mailto:vincent.fri...@gmail.com>> a écrit :
Dans ma zone de test il y a donc un peu plus de 34% de bâtiment
ayant un import dont le score est d'au moins 90%.
Je vais essayer d'implémenter l'astuce décrite dans mon précédent
mail : pour chacun des bâtiments OSM regrouper les imports par
nombre d'étages pour voir si je peux les "cumuler" afin
d'atteindre le bon score minimal.
J'ai refait quasiment tout mon programme afin d'être bien générique
(il peut travailler sur n'importe quel tag de n'importe quel élément
et non pas simplement sur le nombre d'étage des bâtiments) et surtout
pour avoir ce "cumul" des scores des imports.
Voici donc les stats avec l'ancienne et la nouvelle méthode : pour
chaque bâtiment l'ancienne méthode ne considère que l'import avec le
meilleur score alors que la nouvelle méthode regroupe les imports
ayant le même nombre d'étages pour additionner leur score ce qui
permet d'avoir des résultats légèrement meilleurs.
INFO === Statistics ===
INFO *** Statistics with the old matching method ***
INFO Number of matched elements: 2568
INFO Number of updatable elements: 0
INFO Number of updated elements: 0
INFO Repartition by matching scores:
INFO - between 0% and 10% : 37 (1%) elements including 0 that have
been updated (0 were updatable)
INFO - between 10% and 20% : 62 (2%) elements including 0 that have
been updated (0 were updatable)
INFO - between 20% and 30% : 136 (5%) elements including 0 that have
been updated (0 were updatable)
INFO - between 30% and 40% : 220 (8%) elements including 0 that have
been updated (0 were updatable)
INFO - between 40% and 50% : 275 (10%) elements including 0 that have
been updated (0 were updatable)
INFO - between 50% and 60% : 270 (10%) elements including 0 that have
been updated (0 were updatable)
INFO - between 60% and 70% : 176 (6%) elements including 0 that have
been updated (0 were updatable)
INFO - between 70% and 80% : 201 (7%) elements including 0 that have
been updated (0 were updatable)
INFO - between 80% and 90% : 302 (11%) elements including 0 that have
been updated (0 were updatable)
INFO - between 90% and 100% : 889 (34%) elements including 0 that
have been updated (0 were updatable)
INFO *** Statistics with the new matching method ***
INFO * Statistics for the updatable tag building:levels
INFO Number of matched elements: 2550
INFO Number of updatable elements: 0
INFO Number of updated elements: 0
INFO Repartition by matching scores:
INFO - between 0% and 10% : 31 (1%) elements including 0 that have
been updated (0 were updatable)
INFO - between 10% and 20% : 23 (0%) elements including 0 that have
been updated (0 were updatable)
INFO - between 20% and 30% : 50 (1%) elements including 0 that have
been updated (0 were updatable)
INFO - between 30% and 40% : 150 (5%) elements including 0 that have
been updated (0 were updatable)
INFO - between 40% and 50% : 263 (10%) elements including 0 that have
been updated (0 were updatable)
INFO - between 50% and 60% : 265 (10%) elements including 0 that have
been updated (0 were updatable)
INFO - between 60% and 70% : 202 (7%) elements including 0 that have
been updated (0 were updatable)
INFO - between 70% and 80% : 209 (8%) elements including 0 that have
been updated (0 were updatable)
INFO - between 80% and 90% : 335 (13%) elements including 0 that have
been updated (0 were updatable)
INFO - between 90% and 100% : 1022 (39%) elements including 0 that
have been updated (0 were updatable)
Avec la nouvelle méthode la tranche des 90%->100% passe ainsi de 34% à
39%, c'est toujours ça de pris.
Personnellement j'aimerais bien qu'on prenne également la tranche des
80%->90% car il faut bien voir que le découpage d'OSM est vraiment
grossier par rapport à celui d'OpenDataParis et qu'il y a forcément
des différences de surfaces assez importantes. Si on se dit que ma
zone de test dans le 12e arrondissement est assez représentative (on
aura à peu près les mêmes pourcentages sur l'ensemble de Paris) et
qu'on accepte cette tranche de 80%->90% cela permettrait de mettre à
jour plus de la moitié des immeubles parisiens (39 + 13 = 52%). Mais
je comprends tout à fait que cela puisse vous gêner et que vous
préfériez ne rien mettre à jour plutôt que de mettre à jour des
données "fausses" (même si pour moi elles ne sont pas fausses mais
juste légèrement simplistes en raison des données existantes ;p).
Voila j'attends vos retours avant de me lancer mon programme sur le
serveur live.
++ Vincent.
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr