L'indice de confiance est juste le score retourné par le géocodeur addok sur la base de la BAN. Le score ne tient pas compte du niveau du résultat (ville, rues, numéro de rue), mais de la proximité de la chaine géocodé avec celle du résultat. Si je demande "Paris", je vais avoir "Paris" en retour avec un très bon score, ce n'est pas pour autant précis.

Frédéric.


Le 23/12/2017 à 15:36, PanierAvide a écrit :
Bonjour Marc,

En creusant un peu, quelques pistes de réponses sur l'indice confidence. Le code source ici de l'analyse Osmose [1] semble montrer que le géocodage est fait via l'API adresse.data.gouv.fr. L'info affichée "confidence" est donc uniquement basée sur le géocodage. Et le calcul de cet indice n'est pas décrit, mais est normé entre 0 et 1 (voir [2]), à priori en ayant une valeur élevée pour une bonne qualité de géocodage.

Cordialement,

Adrien.

[1] https://github.com/osm-fr/osmose-backend/blob/f43564d78f590a7d3fd9493bbf2f720a0a9379c4/analysers/analyser_merge_heritage_FR_merimee.py
[2] https://adresse.data.gouv.fr/api/

Le 23/12/2017 à 15:11, marc marc a écrit :
Bonjour,

justement en parlant d'intégration, à cartomobilité, on a discuté cette
semaine entre autre de l'indice "confidence" et quelque chose nous
échappe. au point qu'on n'a pas trouvé comment l'utiliser.

exemple 1 : maj d'un monument historique
https://www.openstreetmap.org/way/111799738
https://osmose.openstreetmap.fr/fr/error/14890873491
indice confidence 0.94 localisé par le nom de la ville.
le fait que c'est localisé uniquement par la ville devrait donner un
mauvais taux de confiance.
le fait que c'est localisé dans osm avec un ref tendrait à avoir une
confiance parfaite.
le fait que les tag à mettre à jour ne sont pas en conflit tendrait
aussi à avoir un bon taux de confiance dans la maj
mhs:inscription_date = 2007 -> 2007-01-18

exemple 2 : maj d'un monument historique
https://www.openstreetmap.org/relation/1709140
https://osmose.openstreetmap.fr/fr/error/14890871852
indice confidence 0.23 localisé par le nom de la ville.
Il y a également une ref unique.
Quelle différence avec l'exemple 1 provoque une telle différence dans
l'indice de confiance ?

exemple 3 :
https://osmose.openstreetmap.fr/fr/error/14890868021
positioned at housenumber with confidence 0.35
Le fait que c'est localisé par le numéro de maison donne une meilleur
confiance dans la position géographique.
Mais l'objet a aussi une ref donc la position n'est-elle pas supposée
être "parfaite" ? ou en tout cas, on peux supposer qu'en l'absence de
conflit entre les données, le "match" entre la donnée opendata et la
donnée osm est parfait puisque basée sur une ref + donnée correcte de
l'adresse

exemple 4 :
https://osmose.openstreetmap.fr/fr/error/14891087879
pas d'indice de confiance pourtant on a la même phrase sur la méthode de
localisation utilisée.

exemple 5 : intégration d'un monument
https://osmose.openstreetmap.fr/fr/error/14890860331
Trois-Maries (rue des) 19, Lyon (positioned at city with confidence 0.18)
l'adresse est connue mais l'indice semble basée uniquement sur la ville.
pourtant l’adresse existe dans osn
https://www.openstreetmap.org/node/2809947300
Qu'est-ce qui fait qu'osmose n'utilise que la localisation de la ville
et pas celle de l'adresse ?
le match rate tant en position qu'en type d'objet.
si on flag en faux positif, la prochaine analyse testera-t-elle de
trouver un nouveau match ou plus de maj proposée pour cette intégration
opendata ?

exemple 6 :
https://osmose.openstreetmap.fr/fr/error/14890860273
positioned at housenumber with confidence 0.58
comment osmose fait-il puisqu'il n'y a pas encore ces adresse dans osm ?
d'ailleurs le match a raté (osmose a sélectionnée la muraille de la
ville au lieu d'un bâtiment entre les 2 rues en question).

On se posait par conséquent de nombreuses questions :
- comment est calculé cette indice de confiance ? uniquement à partir de
la localisation "adresse postale" dans le fichier opendata ? si oui pq
certains n'ont pas d'indice ?
- le taux le plus fiable c'est 0 ou 1 ? :-)
- lorsqu'il existe une ref, celle-ci est-elle utilisée ?
ou la ref sert juste à choisir la catégorie "mettre à jour" par rapport
à "intégration possible" ?
- cette indice de confiance est-il ou pas modulé en fonction de la
présence ou l'absence de conflit dans les maj proposée ? ou faudrait-il
un autre indice (fiabilité ?) pour cela ?
- est-il possible de filtrer sur ces 2 critères (fiabilité du match
osm<>opendata et fiabilité de la maj) ? tant dans l'interface web que l'api.

le but serrait par exemple de pouvoir lister tous les intégrations
"fiable" afin de proposer des opérations automatique très ciblée comme
par exemple faire un import des tag wheelchair sur les bureaux de poste
donc le match opendata<>osm est "parfait".
A l'inverse pouvoir sélectionner les cas nécessitant de la réflexion
serrait aussi utile (par exemple un bureau de poste qui aurait la ref
d'un bureau situé "trop loin" ou dont l'adresse est en conflit)

Cordialement,
Marc
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr




_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à