A mon avis, il serait possible d'éprouver ton programme d'import, en acceptant jusqu'à 80 %, en générant un import sur une zone clairement délimité, afin de pouvoir juger sur pièces.

En comparant avec cadastre, openstreetview, terrain, ... chacun pourra juger du degré d'approximation tolérable à son sens.

Brice


Le 02/04/2015 11:13, Vincent Frison a écrit :
Le 31 mars 2015 10:52, Vincent Frison <vincent.fri...@gmail.com <mailto:vincent.fri...@gmail.com>> a écrit :

    Dans ma zone de test il y a donc un peu plus de 34% de bâtiment
    ayant un import dont le score est d'au moins 90%.

    Je vais essayer d'implémenter l'astuce décrite dans mon précédent
    mail : pour chacun des bâtiments OSM regrouper les imports par
    nombre d'étages pour voir si je peux les "cumuler" afin
    d'atteindre le bon score minimal.


J'ai refait quasiment tout mon programme afin d'être bien générique (il peut travailler sur n'importe quel tag de n'importe quel élément et non pas simplement sur le nombre d'étage des bâtiments) et surtout pour avoir ce "cumul" des scores des imports.

Voici donc les stats avec l'ancienne et la nouvelle méthode : pour chaque bâtiment l'ancienne méthode ne considère que l'import avec le meilleur score alors que la nouvelle méthode regroupe les imports ayant le même nombre d'étages pour additionner leur score ce qui permet d'avoir des résultats légèrement meilleurs.

 INFO === Statistics ===
 INFO *** Statistics with the old matching method ***
 INFO Number of matched elements: 2568
 INFO Number of updatable elements: 0
 INFO Number of updated elements: 0
 INFO Repartition by matching scores:
INFO - between 0% and 10% : 37 (1%) elements including 0 that have been updated (0 were updatable) INFO - between 10% and 20% : 62 (2%) elements including 0 that have been updated (0 were updatable) INFO - between 20% and 30% : 136 (5%) elements including 0 that have been updated (0 were updatable) INFO - between 30% and 40% : 220 (8%) elements including 0 that have been updated (0 were updatable) INFO - between 40% and 50% : 275 (10%) elements including 0 that have been updated (0 were updatable) INFO - between 50% and 60% : 270 (10%) elements including 0 that have been updated (0 were updatable) INFO - between 60% and 70% : 176 (6%) elements including 0 that have been updated (0 were updatable) INFO - between 70% and 80% : 201 (7%) elements including 0 that have been updated (0 were updatable) INFO - between 80% and 90% : 302 (11%) elements including 0 that have been updated (0 were updatable) INFO - between 90% and 100% : 889 (34%) elements including 0 that have been updated (0 were updatable)
 INFO *** Statistics with the new matching method ***
 INFO * Statistics for the updatable tag building:levels
 INFO Number of matched elements: 2550
 INFO Number of updatable elements: 0
 INFO Number of updated elements: 0
 INFO Repartition by matching scores:
INFO - between 0% and 10% : 31 (1%) elements including 0 that have been updated (0 were updatable) INFO - between 10% and 20% : 23 (0%) elements including 0 that have been updated (0 were updatable) INFO - between 20% and 30% : 50 (1%) elements including 0 that have been updated (0 were updatable) INFO - between 30% and 40% : 150 (5%) elements including 0 that have been updated (0 were updatable) INFO - between 40% and 50% : 263 (10%) elements including 0 that have been updated (0 were updatable) INFO - between 50% and 60% : 265 (10%) elements including 0 that have been updated (0 were updatable) INFO - between 60% and 70% : 202 (7%) elements including 0 that have been updated (0 were updatable) INFO - between 70% and 80% : 209 (8%) elements including 0 that have been updated (0 were updatable) INFO - between 80% and 90% : 335 (13%) elements including 0 that have been updated (0 were updatable) INFO - between 90% and 100% : 1022 (39%) elements including 0 that have been updated (0 were updatable) Avec la nouvelle méthode la tranche des 90%->100% passe ainsi de 34% à 39%, c'est toujours ça de pris.

Personnellement j'aimerais bien qu'on prenne également la tranche des 80%->90% car il faut bien voir que le découpage d'OSM est vraiment grossier par rapport à celui d'OpenDataParis et qu'il y a forcément des différences de surfaces assez importantes. Si on se dit que ma zone de test dans le 12e arrondissement est assez représentative (on aura à peu près les mêmes pourcentages sur l'ensemble de Paris) et qu'on accepte cette tranche de 80%->90% cela permettrait de mettre à jour plus de la moitié des immeubles parisiens (39 + 13 = 52%). Mais je comprends tout à fait que cela puisse vous gêner et que vous préfériez ne rien mettre à jour plutôt que de mettre à jour des données "fausses" (même si pour moi elles ne sont pas fausses mais juste légèrement simplistes en raison des données existantes ;p).

Voila j'attends vos retours avant de me lancer mon programme sur le serveur live.

++ Vincent.



_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à