Le 29/07/2019 à 18:06, Christian Quest a écrit :
Le lun. 29 juil. 2019 à 16:07, Phyks <ph...@phyks.me
<mailto:ph...@phyks.me>> a écrit :
Salut Fred,
Quelques remontées de plus sur Sirene :
1. J'ai des entreprises radiées qui apparaissent. Par exemple,
https://osmose.openstreetmap.fr/fr/error/30133361229 mais qui a été
radiée en mars 2019 normalement :
https://www.societe.com/societe/les-p-tites-pupilles-789829991.html.
Peut être que ça vient des données sources qui ne sont pas assez
fraîches ceci dit.
Là aussi WARNING... l'INSEE diffuse désormais toutes les entreprise
(et leurs établissements), actifs ou non (radié, etc).
Je ne sais pas si l'analyse osmose prends bien ça en compte dans les
données source.
Pour le cas présent l'entreprise est toujours active d'après l'INSEE:
https://avis-situation-sirene.insee.fr/ListeSiretToEtab.action?form.siren=789829991&form.nic=00015
Attention, radié d'un greffe ne veut pas dire que l'entreprise
n'existe plus, elle est peut être rattachée à un autre greffe ;)
Oui, c'est le bazar et difficile de s'y retrouver !
Normalement c'est bon. On ne garde que les etatAdministratifEtablissement=A
2. J'ai des rapprochements non faits liés au type de POI:
- https://osmose.openstreetmap.fr/fr/error/30133356361
annoté dans OSM
comme un shop=deli.
47.21Z, Commerce de détail de fruits et légumes en magasin spécialisé
non intégré
Ok. j'ajoute shop=deli
https://github.com/osm-fr/osmose-backend/blob/master/merge_data/shop_FR.mapping.json#L194
- https://osmose.openstreetmap.fr/fr/error/30133363991
annoté dans OSM
comme un amenity=restaurant.
Oui j'ai déjà vu le problème. Il faire comme si restaurant=fast_food
3. J'ai des hôtels qui apparaissent qui n'en sont pas (société
accolé à
un Airbnb ?), par exemple
https://osmose.openstreetmap.fr/fr/error/30133362002. Le site SIRENE
(https://avis-situation-sirene.insee.fr/ListeSiretToEtab.action?form.nic=00020&form.siren=432216802)
donne un effectif nul. Peut être qu'on peut les filtrer comme ça ?
Il s'agit d'un entrepreneur individuel... à filtrer globalement de mon
point de vue car cela génère bien trop de bruit.
55.10Z, Hôtels et hébergement similaire non intégré
Ok à filtrer sur trancheEffectifs.
4. J'ai une agence de voyage qui est en fait le siège de MSC Croisière
(https://osmose.openstreetmap.fr/fr/error/30133364947). Pas trop
d'idées
pour filtrer ça, à part peut être en ayant des valeurs "typiques"
d'effectifs pour différents types de POIs (shop=travel_agency avec
> 100
personnes est sûrement louche).
Oui, je connais le problème. Mais vraiment d'idée pour filtrer ->
faux-positif
5. J'ai des sociétés qui ont été liquidées qui apparaissent
(https://osmose.openstreetmap.fr/fr/error/30133364905 par exemple, cf
https://www.societe.com/societe/croisiere-jaune-441382231.html), je ne
sais pas trop si ça peut être filtré.
C'est SIRENE qui n'est pas à jour... indiquée comme "actif"
6. social_facility=assisted_living devrait être en synonyme de
social_facility=group_home, cf
https://osmose.openstreetmap.fr/fr/error/30133366669 et
https://www.openstreetmap.org/way/83234566.
C'est ce que je vois de plus évident pour l'instant et responsable
d'une
bonne majorité de faux positifs. Je pourrais jeter un œil plus dans le
détail.
À ton avis pour tous les cas, c'est détaillé ?
https://github.com/osm-fr/osmose-backend/blob/master/merge_data/shop_FR.mapping.json#L863-L938
J'ai reporté les choses à modifier sur github :
https://github.com/osm-fr/osmose-backend/pull/338
Frédéric.
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr