Le jeu. 31 janv. 2019 à 17:19, marc marc <marc_marc_...@hotmail.com> a écrit :
> Le 31.01.19 à 16:06, Francois Gouget a écrit : > > divergence entre la relation boundary d'une ville > > https://www.openstreetmap.org/relation/2098985 > > heu non, ce n'est pas la relation de la ville mais de la commune. > ils ont le même nom mais c'est 2 choses totalement différent. > > > wikipedia pourrait être utilisé pour identifier les traduction > manquantes. > > c'est le sens du plugin wikidata dans josm même si son ergonomie est > améliorable. > > > probablement des problèmes de performance). > > cela pose surtout un problème de licence (même si wikidata lui-même > est cc, tu peux injecter n'importe quelle licence dans wikidata > et pour wikipedia/wikidata. > c'est d'ailleurs mis en grand sur la page du wiki concernée > https://wiki.openstreetmap.org/wiki/Collaboration_with_Wikipedia > > Précision essentielle, Wikidata est CC0, usage libre sans contrainte, c'est pratiquement du domaine public mais avec une origine connue (si on veut la vérifier et on arrive à retrouver cette référence). Ce n'est pas du CCBYSA comme Wikipedia qui est incompatible avec l'ODbL. Mais le gros problème est qu'une grande partie de Wikidata a été importée massivement par des bots depuis Wikipedia (ou les autres wikis de Wikimedia sous la même licence), sans rien demander aux auteurs originaux et sans les citer (l'attribution de source est souvent omise, voire incorrecte ou en tout cas insuffisante si elle ne mentionne que Wikipedia sans lien avec les pages concernées avec leurs auteurs). De fait la licence CC0 de Wikidata est douteuse, une grande partie des données étant en fait toujours sous licence initiale CCBYSA. Et on ne sait pas comment faire le tri. Ne sont sous licence CC0 que les données qui ont été éditées directement sur Wikidata sans aucun import par un bot, on peut faire un tri partiel en cherchant l'auteur des modifs sur chaque attribut (tous les attributs d'un objet n'ont pas la même origine); certains proviennent aussi de dérivation d'éléments Wikidata importés sous CCBYSA, pour produire des déclarations à partir d'un bot prenant sa source sur Wikidata et portant le résultat dessus. Ceci dit nombre des données importées initialement d'une édition de Wikipédia sont largement modifiées ensuite par souvent ambigues. NE reste dans les déclarations alors que les liens des sujets vers les articles Wikipédia "correspondants" (plus ou moins liés au sujet, mais pas nécessairement uniques car les articles peuvent porter sur plusieurs éléments Wikidata réunis et pas forcément les mêmes réunions entre les diverses éditions linguistiques liées). En tant que tel les déclarations de liens vers Wikipédia depuis Wikidata ne sont qu'indicatives et approchantes, pas de vraies affirmation (on ne peut pas faire d'inférence dessus et surtout pas entre les différentes éditions linguistiques affichées). Je pense qu'au delà de ces imports massifs initiaux de Wikiépdia vers Wikidata, les ambiguités sont telles que de nombreux éléments ont été redéfinis et mieux précisés pour devenir plus indépendants des contenus d'articles particuliers sur une édition particulière de Wikipédia (mais pour beaucoup la structure adoptée vient souvent écraser celle faite à partir de la version anglophone même si ce n'est pas la plus pertinente sur un sujet, notamment les sujets fortement géographiquement, linguistiquement, ou culturellement liés) et cela aboutit parfois à des aberrations et des contradictions nouvelles avec ce qui était parfaitement mieux décrit, documenté et structuré dans l'artricle d'origine, là où les contributeurs de l'éditions anglophone ont voulu faire des approximations ou des rapprochements un peu abusifs (et difficiles ensuite à annuler quand l'article anglophone a fait l'objet de décision de fusion). Il s'en suit alors des difficultés pour les autres éditions à maintenir des distinctions pourtant claires (mais mal comprises par les anglophones). Wikidata commence à s'amériorer toutetois en ayant créé des objets "lexèmes" (liés précisément à une langue de référence) distinct des sujets confondus par la terminologie. Mais le travail sera long. En attendant la pertinence des liens Wikipédia indiqués dans les sujets wikidata est souvent assez peu convaincante (et l'est de moins en moins), mais on butte sur les terminologies anglophones. Personnellement je trouve que la classification sur Commons est plus pertinente (au mopins elle est concertée par une communauté plus large que la seule communauté anglophone avec ses propres contradictions) car Commons butte nettement moins sur la terminologie et n'impose pas l'anglais partout comme référence quand il n'est pas pertinent. Pourtant les imports massifs de données depuis Wikipédia (notamment anglophone) continuent vers Wikidata qui ne peut se prévaloir d'une licence CC0 quand il y a beaucoup trop de données en fait sous licence CCBYSA d'origine et pas revus après imports d'après l'ontologie et la classification Wikidata). A terme les liens Wikipédia devraient ne plus se baser sur les sujets mais d'avantage sur les lexèmes quand leur traduction est suffisamment claire et n'intorduit pas trop d'ambiguités ou d'approximations ou contradictions. il y a pourtant de bons données fiables sur Wikidata qui se sont affranchies des contraintes de classification approchée des wiki CCBYSA d'origine. Mais on bute encore sur les différentes politiques entre éditions et projets, et la séparation des communautés en terme de décision collective (et parfois leurs intolérances entre elles, notamment la communauté anglophone qui pense mieux savoir que les éditions locales sur des sujets fortement liés à ces communautés locales, et qui veut souvent imposer sa terminologie même si elle est ambiguë ou contradictoire, et accepte mal d'utiliser à la place des termes dans leur langue d'origine, seulement translitérés mais pas traduits car il n'y a pas de bonne traduction). Sur les sujets fortement géographiques pourtant il ne devrait pas y avoir d'ambiguité, mais on est confronté à des difficultés politiques sur les revendications multiples. et la diversité des points de vue, même pour seulement les coordonnées géographiques. Et même diverses sources standardisées et officielles différent sur ces sujets (Wikidata a encore du mal à gérer des affirmations prenant en compte ces différences de points de vue, et cela donne des batailles d'édition, où finalement ceux qui sont en droit de trancher ne sont que les anglophones qui fondent leurs décision dans un "comité" local n'admettant que les parfaits anglophones pour trancher, et dénigrant les autres qui essayent de se débrouiller honnètement dans cette langue pour défendre leurs positions (face à une certaine intolérance sur des fautes linguistiques mineures ne portant en fait pas sur le sujet débattu).
_______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-fr