Pour sortir les lieux depuis Overpass à l'aide des ID wikidata, une méthode de truand :

- Reprendre la requête sur Paris, élargir le champ de rehcherche, et changer la ligne du select en :
SELECT distinct ?wd WHERE {

- Sortir la liste des tags wikidata en export CSV
- Abattre quelques expressions régulières pour que ça ressemble à de l'Overpass (ajout de l'en-tête, fin de requête, et transformer chaque ligne d'identifiant en une sélection wikidata=la valeur)

Ça donne ça pour les valeurs les plus courantes sorties de Wikidata :
http://overpass-turbo.eu/s/xRn

Soit plus de 200 lieux sur une emprise métropolitaine. On part sur une tâche Maproulette ?

Adrien.


Le 13/04/2018 à 15:31, Noémie Lehuby a écrit :

Hello,

Les deux approches me semblent pertinentes :
celles basée sur les occurrences sera surement plus facile à ajouter à Osmose celle basée sur wikidata fait plus de sens pour partager le travail de nettoyage. Et les magasins sont un bon objectif pour commencer

Voilà une requête limitée aux alentours de Paris : http://tinyurl.com/y8wf63u5 je ne sais pas s'il est possible d'aller plus loin dans le découpage géographique avec cet outil

Une autre approche serait d'utiliser wikidata uniquement pour récupérer les id qui devraient être dans un tag brand:wikidata au lieu de wikidata, puis passer directement à overpass pour les rechercher ...

Noémie

Le 2018-04-13 12:26, PanierAvide a écrit :

Bonjour,

À priori ce serait pas mal de commencer à nettoyer les données, pour éviter l'effet de recopie basée sur ce que fait le voisin. Avec le service Wikidata + OSM, on peut les repérer assez rapidement, exemple avec les magasins de chaînes <https://sophox.org/sophox/#%23Objects%20linking%20to%20place%20of%20business%20with%20%22wikidata%22%20tag%20instead%20of%20%22operator%3Awikidata%22%20tag%0ASELECT%20%3FosmId%20%3FwdLabel%20%3Fwd%20%3FwpTag%20WHERE%20%7B%0A%20%20%23%20Limit%20to%20subjects%20that%20have%20an%20OSM%20type%20%28%27n%27%2C%20%27r%27%2C%20%27w%27%29.%0A%20%20%23%20Replace%20%3FosmType%20with%20a%20string%20%27r%27%20to%20show%20only%20relations.%0A%20%20%3FosmId%20osmm%3Atype%20%3FosmType%20.%0A%0A%20%20%23%20Limit%20to%20subjects%20that%20have%20a%20tag%20called%20%22wikidata%22%0A%20%20%3FosmId%20osmt%3Awikidata%20%3Fwd%20.%0A%0A%20%20%23%20Filter%20out%20entries%20that%20have%20identical%20wikidata%20and%20operator%3Awikidata%0A%20%20%23%20In%20theory%20there%20should%20only%20be%20one%20WP%20tag%0A%20%20FILTER%20NOT%20EXISTS%20%7B%20%3FosmId%20osmt%3Abrand%3Awikidata%20%3Fwd%20.%20%7D%0A%0A%20%20%23%20Include%20Wikipedia%20tag%20if%20it%20exists%0A%20%20OPTIONAL%20%7B%20%3FosmId%20osmt%3Awikipedia%20%3FwpTag%20.%20%7D%0A%0A%20%20%23%20Optionally%2C%20find%20pl%3A%2a%20wikipedia%20tags%20%28point%20to%20Polish%20wiki%29%0A%20%20%23%20For%20performance%2C%20remove%20the%20%22OPTIONAL%20%7B%22%20and%20%22%7D%22%20part%20above%0A%20%20%23%20FILTER%28%20STRSTARTS%28STR%28%3FwpTag%29%2C%20%27https%3A%2F%2Fpl.wikipedia%27%29%29%20.%0A%0A%20%20%23%20Or%2C%20instead%2C%20only%20show%20Wikidata%20items%20that%20have%20a%20Polish%20WP%20article%0A%20%20%23%20You%20may%20also%20want%20to%20add%20%3Farticle%20to%20the%20list%20of%20fields%20returns%20by%20SELECT%20statement%0A%20%20%23%20%20%3Farticle%20schema%3Aabout%20%3Fwd%20.%0A%20%20%23%20%20%3Farticle%20schema%3AisPartOf%20%3Chttps%3A%2F%2Fpl.wikipedia.org%2F%3E.%0A%0A%20%20%23%20Optionally%2C%20restrict%20OSM%20objects%20to%20those%20that%20have%20a%20specific%20tag%20%28and%20value%29%0A%20%20%23%20%20%3FosmId%20osmt%3Aplace%20%27city%27%20.%20%20%20%20%20%20%20%20%23%20exact%20string%20matching%0A%20%20%23%20%20%3FosmId%20osmt%3Aname%3Aen%20%3Fnameen%20.%20%20%20%20%20%23%20unless%20filtered%2C%20matches%20all%20objects%20with%20this%20tag%0A%20%20%23%20%20FILTER%28%20regex%28%3Fnameen%2C%20%22A.b%22%29%20%29%20%20%20%20%23%20filter%20name%3Aen%20to%20match%20a%20regex.%20Not%20very%20efficient%0A%0A%20%20%23%20%3Fwd%20must%20be%20%22instance%20of%22%20an%20enterprise%2C%20or%20instance%20of%20an%20item%20which%20is%20a%20subclass%28es%29%20of%20it.%0A%20%20%3Fwd%20wdt%3AP31%2Fwdt%3AP279%2a%20wd%3AQ507619%20.%0A%0A%20%20%23%20Pick%20the%20first%20available%20language%20for%20the%20wikidata%20entry%20%28creates%20%3FwdLabel%20value%29%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22%5BAUTO_LANGUAGE%5D%2Cen%2Cde%2Cfr%2Cit%2Cpl%2Cru%2Ces%2Csv%2Cnl%22%20.%20%7D%0A%7D%0ALIMIT%2050> (il manque que de filtrer par pays, mais ça dépasse mes compétences en SPARQL). Si on a la bonne requête SPARQL, on peut se partager la tâche par département, et assez rapidement s'en sortir. Le tout c'est de savoir si on commence par les réseaux de transports, les magasins, les équipements... Le plus simple est sûrement les magasins, car ils ont l'air renseignés de manière homogène côté Wikidata, ce qui n'est pas le cas des réseaux de transports.

Une fois que le nettoyage est fait, une bonne analyse Osmose permettra justement d'identifier les nouvelles erreurs. Il faudra par contre voir si c'est possible de créer une analyse basée sur une sortie de wikidata (à priori non ?).

De mon côté je suis partant pour donner un coup de main sur le sujet (j'avais soulevé la question sur talk-fr-bzh en juillet dernier [1]).

Adrien.

[1] https://lists.openstreetmap.org/pipermail/talk-fr-bzh/2017-July/002049.html



Le 13/04/2018 à 11:20, Noémie Lehuby a écrit :

Hello,

Merci. J'ai corrigé les Autolib', mais le problème est plus vaste : on a le même souci avec les Franprix ou les Décathlon par exemple.

Y a des gens motivés pour m'aider à corriger tout ça et/ou bosser sur une analyse Osmose sur le sujet ?

Noémie

Le 2018-04-11 18:58, PanierAvide a écrit :

    Bonjour,

    C'est bien ça, le wikidata=* doit pointer sur l'item
    correspondant à cet objet précis, donc là préférer
    brand:wikidata=* ou operator:wikidata=* (ou network:wikidata si
    Autolib' désigne le nom du réseau parisien).

    Adrien.


    Le 11/04/2018 à 16:13, Noémie Lehuby a écrit :

        Bonjour,

        Le tag wikidata correspondant à Autolib' a été ajouté sur
        les stations Autolib' de région parisienne.
        Par exemple : https://www.openstreetmap.org/node/4472979080

        Il me semble que cela devrait être dans un tag
        brand:wikidata (voire operator:wikidata). Je me trompe ?

        Noémie



        _______________________________________________
        Talk-fr mailing list
        Talk-fr@openstreetmap.org
        https://lists.openstreetmap.org/listinfo/talk-fr

-- PanierAvide
    Géomaticien & développeur


    _______________________________________________
    Talk-fr mailing list
    Talk-fr@openstreetmap.org <mailto:Talk-fr@openstreetmap.org>
    https://lists.openstreetmap.org/listinfo/talk-fr



_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

--
PanierAvide
Géomaticien & développeur

_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org <mailto:Talk-fr@openstreetmap.org>
https://lists.openstreetmap.org/listinfo/talk-fr



_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


--
PanierAvide
Géomaticien & développeur

_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à