Le jeu. 31 janv. 2019 à 17:19, marc marc <marc_marc_...@hotmail.com> a
écrit :

> Le 31.01.19 à 16:06, Francois Gouget a écrit :
> > divergence entre la relation boundary d'une ville
> > https://www.openstreetmap.org/relation/2098985
>
> heu non, ce n'est pas la relation de la ville mais de la commune.
> ils ont le même nom mais c'est 2 choses totalement différent.
>
> > wikipedia pourrait être utilisé pour identifier les traduction
> manquantes.
>
> c'est le sens du plugin wikidata dans josm même si son ergonomie est
> améliorable.
>
> > probablement des problèmes de performance).
>
> cela pose surtout un problème de licence (même si wikidata lui-même
> est cc, tu peux injecter n'importe quelle licence dans wikidata
> et pour wikipedia/wikidata.
> c'est d'ailleurs mis en grand sur la page du wiki concernée
> https://wiki.openstreetmap.org/wiki/Collaboration_with_Wikipedia
>
> Précision essentielle, Wikidata est CC0, usage libre sans contrainte,
c'est pratiquement du domaine public mais avec une origine connue (si on
veut la vérifier et on arrive à retrouver cette référence). Ce n'est pas du
CCBYSA comme Wikipedia qui est incompatible avec l'ODbL.

Mais le gros problème est qu'une grande partie de Wikidata a été importée
massivement par des bots depuis Wikipedia (ou les autres wikis de Wikimedia
sous la même licence), sans rien demander aux auteurs originaux et sans les
citer (l'attribution de source est souvent omise, voire incorrecte ou en
tout cas insuffisante si elle ne mentionne que Wikipedia sans lien avec les
pages concernées avec leurs auteurs).

De fait la licence CC0 de Wikidata est douteuse, une grande partie des
données étant en fait toujours sous licence initiale CCBYSA. Et on ne sait
pas comment faire le tri. Ne sont sous licence CC0 que les données qui ont
été éditées directement sur Wikidata sans aucun import par un bot, on peut
faire un tri partiel en cherchant l'auteur des modifs sur chaque attribut
(tous les attributs d'un objet n'ont pas la même origine); certains
proviennent aussi de dérivation d'éléments Wikidata importés sous CCBYSA,
pour produire des déclarations à partir d'un bot prenant sa source sur
Wikidata et portant le résultat dessus.

Ceci dit nombre des données importées initialement d'une édition de
Wikipédia sont largement modifiées ensuite par souvent ambigues. NE reste
dans les déclarations alors que les liens des sujets vers les articles
Wikipédia "correspondants" (plus ou moins liés au sujet, mais pas
nécessairement uniques car les articles peuvent porter sur plusieurs
éléments Wikidata réunis et pas forcément les mêmes réunions entre les
diverses éditions linguistiques liées).

En tant que tel les déclarations de liens vers Wikipédia depuis Wikidata ne
sont qu'indicatives et approchantes, pas de vraies affirmation (on ne peut
pas faire d'inférence dessus et surtout pas entre les différentes éditions
linguistiques affichées).

Je pense qu'au delà de ces imports massifs initiaux de Wikiépdia vers
Wikidata, les ambiguités sont telles que de nombreux éléments ont été
redéfinis et mieux précisés pour devenir plus indépendants des contenus
d'articles particuliers sur une édition particulière de Wikipédia (mais
pour beaucoup la structure adoptée vient souvent écraser celle faite à
partir de la version anglophone même si ce n'est pas la plus pertinente sur
un sujet, notamment les sujets fortement géographiquement,
linguistiquement, ou culturellement liés) et cela aboutit parfois à des
aberrations et des contradictions nouvelles avec ce qui était parfaitement
mieux décrit, documenté et structuré dans l'artricle d'origine, là où les
contributeurs de l'éditions anglophone ont voulu faire des approximations
ou des rapprochements un peu abusifs (et difficiles ensuite à annuler quand
l'article anglophone a fait l'objet de décision de fusion). Il s'en suit
alors des difficultés pour les autres éditions à maintenir des distinctions
pourtant claires (mais mal comprises par les anglophones).
Wikidata commence à s'amériorer toutetois en ayant créé des objets
"lexèmes" (liés précisément à une langue de référence) distinct des sujets
confondus par la terminologie. Mais le travail sera long. En attendant la
pertinence des liens Wikipédia indiqués dans les sujets wikidata est
souvent assez peu convaincante (et l'est de moins en moins), mais on butte
sur les terminologies anglophones. Personnellement je trouve que la
classification sur Commons est plus pertinente (au mopins elle est
concertée par une communauté plus large que la seule communauté anglophone
avec ses propres contradictions) car Commons butte nettement moins sur la
terminologie et n'impose pas l'anglais partout comme référence quand il
n'est pas pertinent.

Pourtant les imports massifs de données depuis Wikipédia (notamment
anglophone) continuent vers Wikidata qui ne peut se prévaloir d'une licence
CC0 quand il y a beaucoup trop de données en fait sous licence CCBYSA
d'origine et pas revus après imports d'après l'ontologie et la
classification Wikidata). A terme les liens Wikipédia devraient ne plus se
baser sur les sujets mais d'avantage sur les lexèmes quand leur traduction
est suffisamment claire et n'intorduit pas trop d'ambiguités ou
d'approximations ou contradictions.
il y a pourtant de bons données fiables sur Wikidata qui se sont
affranchies des contraintes de classification approchée des wiki CCBYSA
d'origine. Mais on bute encore sur les différentes politiques entre
éditions et projets, et la séparation des communautés en terme de décision
collective (et parfois leurs intolérances entre elles, notamment la
communauté anglophone qui pense mieux savoir que les éditions locales sur
des sujets fortement liés à ces communautés locales, et qui veut souvent
imposer sa terminologie même si elle est ambiguë ou contradictoire, et
accepte mal d'utiliser à la place des termes dans leur langue d'origine,
seulement translitérés mais pas traduits car il n'y a pas de bonne
traduction).

Sur les sujets fortement géographiques pourtant il ne devrait pas y avoir
d'ambiguité, mais on est confronté à des difficultés politiques sur les
revendications multiples. et la diversité des points de vue, même pour
seulement les coordonnées géographiques. Et même diverses sources
standardisées et officielles différent sur ces sujets (Wikidata a encore du
mal à gérer des affirmations prenant en compte ces différences de points de
vue, et cela donne des batailles d'édition, où finalement ceux qui sont en
droit de trancher ne sont que les anglophones qui fondent leurs décision
dans un "comité" local n'admettant que les parfaits anglophones pour
trancher, et dénigrant les autres qui essayent de se débrouiller
honnètement dans cette langue pour défendre leurs positions (face à une
certaine intolérance sur des fautes linguistiques mineures ne portant en
fait pas sur le sujet débattu).
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à